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内 容 简介 


本 书包 括 数字 电路 基础 ( 先 修 部 分 ) .计算 机 组 成 (主体 部 分 ) .计算 机 体系 结构 (提高 部 分 )3 部 分 内 容 ， 
共 13 章 ,重点 讲解 计算 机 系统 的 完整 组 成 和 提高 性 能 的 可 行 途径 。 作 为 硬件 课程 教材 ,兼顾 到 计算 机 科 
学 与 技术 专业 中 偏 工 程 技术 方向 、 偏 软件 方向 的 本 科 生 ,也 可 用 于 软件 学 院 和 计算 机 应 用 方向 的 学 生 。 
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对 这 一 版 的 书 名 做 了 一 点 变动 ,增加 了 ”基本 原理 .设计 技术 与 工程 实现 ”的 副标题 , 特 
意 指出 书 中 提供 3 类 不 同性 质 的 教学 内 容 。 第 一 类 是 计算 机 组 成 原理 与 运行 机 制 的 核心 知 
识 , 属 于 学 生 一 定 要 掌握 的 原理 性 基础 知识 ,在 绝 大 多 数 的 同类 教材 中 都 会 重点 讲解 。 第 二 
类 是 计算 机 硬件 系统 的 基本 设计 技术 ,多 数 同类 教材 中 讲解 不 多 也 欠 具 体 应 用 实例 。 第 三 
类 是 计算 机 硬件 系统 的 入 门 性 工程 实现 问题 ,同类 教材 中 较 少 涉及 ,我 们 希望 在 这 一 版 的 教 
材 中 对 上 述 3 类 内 容 都 有 适度 的 讲解 ,其 中 的 工程 实现 问题 只 在 主教 材 中 简单 提 及 ,主要 部 
分 将 放 到 《计算 机 组 成 与 体系 结构 实验 指导 ;教材 中 。 这 种 安排 体现 了 作者 多 年 坚守 的 教学 
理念 ,从 如 下 3 个 方面 予以 说 明 。 

(1) 针对 计算 机 组 成 原理 这 一 类 含有 较 多 技术 性 、 工 程 性 、 实 践 性 内 容 的 课程 ,教学 安 
排 不 宜 过 分 局 限于 教师 课堂 讲课 、 学 生 课 上 听讲 和 课 后 背书 的 学 习 方式 ,应 该 在 讲课 听课 的 
基础 上 再 较 大 幅度 地 加 强 教学 实践 环节 ,增强 课程 内 容 的 实用 性 ,促成 学 生 用 课堂 学 到 的 理 
论 知识 ,设计 实现 一 台 组 成 简单 完整 .原理 清晰 实用 、 实 验 操作 方便 ,支持 汇编 语言 编程 的 简 
小 计算 机 系统 ,促使 学 生 在 学 习 理论 知识 .掌握 设计 技术 .提升 实践 能 力 等 诸 方面 得 到 全 面 
成 长 。 

(2) 在 讲解 计算 机 硬件 系统 组 成 和 功能 实现 时 ,应 该 把 口语 性 的 一 般 讲解 和 硬件 描述 
语言 的 严谨 描述 恰当 地 结合 起 来 ,鼓励 选用 硬件 描述 语言 设计 计算 机 控制 器 和 描述 整 机 系 
统 , 既 能 体现 计算 机 的 最 新 设计 技术 和 实现 手段 ,保证 教学 内 容 适度 的 先进 性 ,又 可 以 培养 
学 生 严谨 的 思维 方式 和 对 硬件 问题 的 深入 理解 和 准确 阐述 ,这 有 利于 提高 授课 质量 ,降低 学 
习 和 实验 的 难度 。 

(3) 在 课程 的 教学 安排 中 ,需要 处 理 好 硬件 子 系统 (重点 部 分 ) 和 软件 子 系统 (配合 部 
分 ) 的 关系 ,不 能 完全 局 限于 硬件 系统 本 身 , 还 需要 包含 必要 的 软件 内 容 , 汇 编 语 言 程序 设计 
应 该 占有 一 定 分 量 ,加 深 对 硬 、 软 件 两 类 资源 各 自在 计算 机 系统 中 的 地 位 和 作用 的 理解 。 指 
令 系 统 是 连接 硬 、 软 件 系统 的 纽带 ,汇编 语言 编程 有 助 于 深入 了 解 指令 系统 .计算 机 整 机 组 
成 与 运行 控制 机 制 。 因 此 在 教学 计算 机 系统 中 配备 了 3 个 基本 程序 : PC 仿真 终端 程序 、 交 
又 汇编 程序 ,监控 程序 ,对 多 数 同学 来 说 做 到 会 使 用 它们 就 够 了 ,鼓励 有 余力 的 同学 探索 这 
几 个 程序 的 实现 思路 和 方法 。 

本 书包 括 了 数字 电路 基础 .计算 机 组 成 .计算 机 体系 结构 3 部 分 内 容 , 共 13 章 。 

第 1 章 是 全 书 内 容 的 概述 部 分 ,简要 介绍 计算 机 组 成 和 体系 结构 的 基本 概念 ,从 实现 功 
能 的 角度 介绍 计算 机 硬件 系统 的 5 个 功能 部 件 ; 从 功能 和 层次 的 观点 来 讲解 计算 机 组 成 和 
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体系 结构 各 自 需 要 研究 和 解决 的 问题 ,并 简要 说 明了 本 课程 的 教学 目标 和 对 学 习 方 法 的 
建议 。 

第 2 章 简明 讲解 数字 电路 基础 知识 和 几 种 常用 的 电路 芯片 ,是 为 讲解 计算 机 组 成 和 体 
系 结构 做 电子 线路 方面 的 准备 ,没有 这 些 知 识 是 很 难 学 懂 计 算 机 硬件 的 组 成 和 运行 原理 的 。 

第 3 章 的 数据 表示 和 运算 、 第 4 章 的 运算 器 部 件 共同 构成 本 书 核心 内 容 的 第 1 个 知识 
单元 ,主要 围绕 承担 数据 运算 功能 的 运算 器 部 件 进行 讲解 ,在 给 出 通用 的 基本 原理 知识 的 同 
时 ,还 提供 了 设计 实现 一 个 原理 性 的 8 位 运算 器 模型 和 一 个 4 位 位 片 结构 的 运算 器 芯片 两 
个 实例 ,展现 运算 器 部 件 的 设计 过 程 和 实现 方法 ,提升 学 生 的 实践 能 力 。 

第 5 章 的 指令 系统 和 第 6 章 的 控制 器 部 件 共同 构成 本 书 核心 内 容 的 第 2 个 知识 单元 ， 
主要 围绕 指令 格式 选择 .指令 系统 设计 ,以 及 硬件 系统 中 的 硬 布线 方案 的 控制 器 部 件 进行 讲 
解 , 而 对 微 程序 方案 控制 器 只 作 适 当 介绍 。 在 给 出 通用 的 基本 原理 知识 的 同时 ,提供 了 一 套 
简单 实用 的 基本 指令 系统 。 硬 件 方面 ,选用 多 指令 周期 方案 实现 这 套 指令 系统 的 控制 器 部 
件 的 具体 例子 ,展现 控制 器 部 件 的 设计 过 程 和 实现 方法 ,提升 学 生 的 实践 能 力 。 软 件 方面 ， 
使 用 这 套 指令 系统 设计 了 教学 机 的 监控 程序 ,可 以 支持 汇编 语言 程序 设计 ; 若 再 扩展 一 部 分 
指令 ,也 可 以 支持 解释 执行 的 BASIC 高 级 语言 程序 设计 ,能 支持 浮 点 数 运算 和 多 种 基本 数 
学 函数 运算 。 针 对 这 门 课程 的 教学 要 求 来 说 ,此 时 的 教学 机 的 硬 软件 系统 已 经 比较 完整 , 包 
括 了 计算 机 硬件 软件 系统 全 部 6 个 层次 的 基本 内 容 。 

第 7 章 的 主 存 .第 8 章 的 高 速 缓存 和 虚 存 ,第 9 章 的 辅助 存储 器 设备 共同 构成 本 书 核心 
内 容 的 第 3 个 知识 单元 ,主要 围绕 计算 机 3 级 结构 的 存储 器 件 系统 和 外 存储 器 设备 进行 讲 
解 ,还 给 出 了 通过 字 、 位 扩展 技术 ,用 静态 芯片 构建 内 存储 器 部 件 的 具体 例子 ,支持 存储 器 与 
CPU 同步 运行 ,展现 内 存储 器 的 功能 和 经 总 线 连 接 CPU 的 具体 方法 。 

第 10 章 的 输入 输出 设备 和 第 11 童 的 输入 输出 系统 共同 构成 本 书 核心 内 容 的 第 4 个 知 
识 单元 ,主要 围绕 承担 计算 机 的 输入 输出 功能 的 设备 或 者 部 件 进行 讲解 ,给 出 了 用 于 连接 计 
算 机 各 个 部 件 的 单 总 线 结构 的 实际 例子 ,具体 介绍 了 串 行 接口 的 内 部 线路 组 成 和 使 用 方法 ， 
并 通过 串口 连接 PC 仿真 终端 ,选用 程序 查询 方式 控制 入 出 设备 ,使 教学 机 整 机 系统 具备 了 
输入 输出 操作 功能 。 

第 12 章 的 流水 线 技术 和 第 13 章 的 并 行 计算 机 体系 结构 共同 构成 本 书 核心 内 容 的 第 5 
个 知识 单元 ,对 应 计算 机 体系 结构 课程 的 基础 知识 ,针对 提高 计算 机 系统 的 性 能 ,更 多 地 强 
调 基 本 概念 、 提 出 问题 的 思路 和 解决 问题 的 方案 ,基本 上 止步 于 定性 说 明 。 

教学 过 程 中 ,可 以 根据 不 同 的 课程 安排 和 教学 要 求 ,合理 分 配 教材 中 3 部 分 内 容 的 课时 
比例 。 针 对 把 计算 机 组 成 和 系统 结构 合并 成 一 门 课程 的 安排 ,教材 第 3 一 13 章 的 内 容 都 属 
于 必 学 知识 ,建议 教学 学 时 安排 为 70 一 90。 若 只 是 用 于 计算 机 组 成 原理 课程 ,计算 机 体系 
结构 的 内 容 另 外 开课 , 则 只 需 讲 解 第 3 一 11 章 中 的 知识 ,建议 课 内 学 时 安排 为 60 一 70, 另 外 
安排 约 16 个 实验 学 时 。 

第 2 章 用 于 复习 先 修 课 程 的 内 容 ,简明 介绍 数字 电路 与 逻辑 设计 知识 , 约 占 教材 总 篇 幅 
的 7%, 是 学 习 计算 机 组 成 和 体系 结构 一 定 会 用 到 的 电路 基础 知识 ,也 许 要 求 并 不 太 多 也 不 
深 , 但 如 果 完 全 不 了 解 这 些 内 容 ,要 听 懂 课堂 授课 内 容 难度 很 大 ,设计 实现 一 个 小 计算 机 系 
统 更 无 从 谈 起 。 

第 1 章 . 第 3 一 11 章 是 课程 的 主体 部 分 , 约 占 教材 总 篇 幅 的 73%, 主 要 是 计算 机 组 成 方 


面 较为 完整 的 系统 知识 ,重点 围绕 基本 计算 机 硬件 系统 5 个 功能 部 件 的 功能 和 组 成 进行 分 
析 讲 解 。 

第 12 章 和 第 13 章 是 本 课程 的 提高 部 分 , 约 占 教 材 总 篇 幅 的 20% ,主要 是 计算 机 体系 
结构 方面 的 基础 知识 ,重点 介绍 提高 计算 机 系统 性 能 的 各 种 可 行 思路 与 基本 途径 。 

在 教学 环节 安排 中 ,需要 处 理 好 理论 教学 和 教学 实验 的 关系 ,可 以 考虑 (并 非 一 定 如 此 ) 
用 约 四 分 之 三 的 课 内 学 时 (例如 48 学 时 ) 讲 授 计 算 机 组 成 与 运行 机 制 的 核心 知识 ,四 分 之 一 
的 课 内 学 时 中 的 一 小 部 分 (例如 6 学 时 ) 用 于 讲解 构建 整 机 系统 用 到 的 设计 技术 和 工程 实现 
问题 。 剩 余 的 部 分 (例如 10 学 时 ) 和 16 个 实验 学 时 统一 安排 用 于 教学 实验 ,在 教师 的 指导 
下 去 完成 设计 实现 小 计算 机 硬件 系统 的 核心 工作 ,更 好 地 贯彻 理论 指导 实践 ,通过 实践 再 进 
一 步 深入 理解 理论 的 认 知 过 程 ,做 到 学 习 知 识 和 增长 能 力 的 双 丰 收 。 

本 教材 配套 的 有 : 四 内 容 详 尽 的 教学 实验 指导 教材 ; 回教 学 实验 设备 (由 清华 大 学 科 
教 仪器 厂 生产 销售 ,型 号 是 TEC-XP-[ ) ,选用 教材 第 1 一 4 个 知识 单元 的 部 件 实例 组 合 而 
成 ,能 够 确保 课堂 授课 内 容 和 教学 实验 项 目 完 美的 结合 ; @@PowerPoint 教学 课件 ; 图 指令 
级 软件 模拟 系统 ,可 以 直接 在 PC 系统 中 运行 ,实现 了 与 硬件 设备 相同 的 运行 功能 。 良 好 的 
教学 实践 环境 和 实验 条 件 , 可 以 有 效 地 加 深 对 课堂 教学 内 容 的 理解 ,并 使 得 学 生 在 一 定 程度 
上 获得 开展 研究 工作 和 开展 计算 机 硬件 系统 设计 的 实际 经 验 , 全 面 提高 解决 实际 问题 和 创 
新 思维 的 能 力 。 

本 书 的 第 1 一 3 章 、 第 7~13 章 由 宋佳 兴修 订 , 第 4 一 6 章 由 王 诚 修订 ,作者 有 多 年 从 事 
本 专业 教学 和 科研 工作 的 经 历 。 

由 于 时 间 和 作者 水 平 所 限 , 加 上 时 间 仓促 , 书 中 难免 存在 不 足 之 处 , 敬 请 读者 批评 指正 。 


编 者 
2016 年 6 月 于 清华 大 学 计算 机 科学 与 技术 系 





上 二 上 上 
an 性 





计算 袖 蒜 闹 概 带 生 0 交 生计 二 二 和 


计算 机 系统 的 基本 组 成 及 其 层次 结构 ppp 1] 
计算 机 硬件 的 5 个 功能 部 件 及 其 功能 pp 
计算 机 和 芸 统 主要 的 技术 与 性 能 指标 assssn sanasaassnsaraisssiasaniannsisissaaaasois 了 
计算 机 的 体系 结构 ,组 成 和 实现 概述 ss 
1 证 自视 发 展 进步。 分 类 和 拓展 应 用 的 进程 ， i 





第 2 章 
| 


2.2 


本 章 内 容 小 绪 和 学 习 方法 建议 nn 37 


数字 电路 基础 和 常用 器 件 1 


2.1.2 应 用 案例 pp 
数字 电路 基础 及 其 相关 处 理 方法 
2.2.1 3 种 基本 逻辑 关系 …… 
2.2.3 ”逻辑 函数 的 特性 、 规 则 与 应 用 
组 合 逻 辑 电路 及 时 序 逻 辑 电 路 ……… . 
2.3.1 常用 逻辑 门 器 件 …… a 
2. 3.2 时 序 罗 辑 电路 

2.3.3 存储 器 芯片 简介 - 多 3 
2. 3.4 几 个 专用 功能 器 件 和 存储 器 芯片 的 引 脚 图 PP 32 
现场 可 编程 逻辑 器 件 及 其 应 用 … 

2.4.1 现场 可 编程 器 件 概 述 - 
2.4.2 CPLD 和 FPGA 的 编程 与 应 









习题 与 思考 题 7 


计算 机 组 成 与 体系 结构 (第 3 版 ) 





3.2 


本 章 内 容 小 结 和 学 习 方 法 建议 
习题 与 思考 题 . ee 


数据 表示 、 运 算 算法 和 线路 实现 ……………… 加 


数字 化 信息 编码 的 概念 和 二 进 制 编码 知识 二 ee 839 
3.1.1 数字 化 信息 编码 的 概念 ………- - 
3.1.2 二 进 制 编码 和 码 制 转换 … 
-| 检 错 纠 错 码 ee 
3.2.2 字符 类 型 数据 的 表示 … - 
3.2.3 多 媒体 信息 编码 

二 进 制 数值 数据 的 编码 方案 与 运算 算法 … 

3.3.1 原 码 、 反 码 、 补 码 的 定义 

3.3.2 补 码 加 、 减 运算 规则 和 电路 实现 ， 有 
3, 3.4 实现 乘法 .除法 的 其 他 方案 00 














第 妇 读 、 浅 第 中 柱 


4. 


4.2 定点 运算 器 … 


1 


算术 逻辑 运算 单元 的 功能 设计 与 线路 实现 … 5 







4.2.1 定点 运算 器 部 件 的 功能 、 组 成 与 控制 概述 …… ww 
4.2.2 设计 实现 一 个 简单 的 原理 性 8 位 运算 器 模型 
4.2.3 运算 器 芯片 Am2901 实例 与 使 用 . 加 6 
4.2.4 MIPS 多 指令 周期 CPU 系统 的 运算 器 的 组 成 及 其 功能 ……………… 90 
浮 点 运算 和 浮 点 运算 器 … 名 
4.3.1 浮 点 数 的 运算 规则 
4.3.2 浮 点 运算 器 举例 ， 





本 章 内 容 小 结 和 学 习 方法 建议 . Se 


习题 与 思考 题 ， 


第 5 章 


5. 


1 


指令 系统 和 汇编 语言 程序 设计 ee 102 


指令 格式 和 指令 系统 概述 ee 
1.1 指令 的 定义 和 指令 格式 … 
操作 码 的 组 织 与 编码 … ee 
有 关 操作 数 的 类 型 个 数 ,来 源 ,去 向 和 地 址 安排 
指令 的 分 类 … ee ee 
指令 周期 及 其 对 计算 机 性 能 和 硬件 结构 的 影响 … 


a 


a 





A A A 
六 上天 
an 上 


5.2 rhe 1108 
5.3 令 系 统 举例 . ee 1 
3.1 _ Pentium 了 [计算 机 的 指令 系统 … 1 
3.2 MIPS32 计算 机 的 指令 系统 … 
3.3 PDP-11 计算 机 的 指令 系统 
5.3.4 教学 计算 机 的 指令 系统 ……… ee es 四 
5.4.1 汇编 语言 及 其 程序 设计 中 的 有 关 概 念 ……eeeeeeeeeeeooseonooonnnnnnn， 120 

.4.2 教学 计算 机 的 汇编 程序 设计 举例 … i 
Se ee 
习题 与 思考 题 … i 


第 6 章 控制 器 部 件 e130 


6.2.1 硬 布线 控制 器 的 组 成 和 运行 原理 简介 .… AR 证 吉 
6.2.2 MIPS32 计算 机 的 控制 器 简介 … a a 
6.2.3 TEC_XP_[ 教 学 计算 机 的 硬 布线 控制 器 的 设计 与 实现 ， 
6.3 微 程序 控制 器 部 件 ， 2 
6.3.1 微 程序 控制 器 的 基本 组 成 和 运行 原理 … er 
6.3.2 ” 微 程 序 设 计 中 的 下 地 址 形成 逻辑 和 微 程序 设计 ……………………… 
6.3.3 TEC-XP-T 教 学 计算 机 的 微 程 序 控制 器 的 设计 与 实现 
es Re 


7.1.1 存储 器 分 类 …- Pn 
7.1.2 存储 器 系统 目标 ey 
7.1.3 多 级 结构 存储 器 系统 ee ]169 
7.2.1 主 存储 器 概述 ………… 
7.2.2 动态 存储 器 的 存储 原理 -… 
7.2.3 静态 存储 器 的 存储 原理 … ok 
7.2.4 存储 器 容量 扩展 e174 
7.3 ”教学 计算 机 的 主 存 储 器 实例 e176 
7.4 ”提高 主 存储 器 性 能 的 途径 ， i 
本 章 内 容 小 结 和 学 习 方法 建议 ee 
习题 与 思考 题 … 2 


a a 





Cn 





cn 
心 



























计算 机 组 成 与 体系 结 攀 (第 3 版) 





高 速 缓冲 存储 器 和 虚拟 存储 器 ………… 


… 183 


… 185 
… 187 
2 了 90 
”190 
… 190 
"» 191 


本 章 内 容 小 结 和 学 习 方 法 建议 … nn 


8.1.1 Cache 的 运行 原理 …… 
8.1.2 Cache 的 3 种 映像 方式 … 
8.1.3 Cache 实用 中 的 问题 … 
虚拟 存储 器 
8.2.1 虚拟 存储 器 的 概念 介绍 … 
8.2.2 段 式 存储 管理 … 

8.2.3 页 式 存 储 管理 … 





习题 与 思考 题 … 


第 9 章 


9.1 


9.2 


9.3 
9.4 


外 入 站 估 末 运 基 二 有 天 生出 下 利生 利和 


外 竹 设 备 概 和 einaiisin i 
i 
a 
TN 
:1 
9.28 全 失 控制 凑 7Di 
“202 
… 205 
*» 205 
CO eM th 
… 208 
9.4.5 Blu-Ray TT 
本 章 内 容 小 结 和 学 习 方法 建议 … ECE 

ee .. 209 


磁盘 阵列 …… 
光盘 设备 … 
9.4.1 只 读 光盘 … 


9.4.3 可 擦 写 光 盘 


习题 与 思考 题 … 


第 10 章 


0 
10.2 
10.3 


输入 输出 设备 


BE Th 
“211 
2 
10.3.1 点 阵 式 输出 设备 基本 原理 nn 
10.3.2 显示 器 的 组 成 和 运行 原理 ee 
10.3.3， 打 印 机 的 组 成 和 运行 原理 -ni 
… 221 


常用 的 输入 设备 … 
常用 的 输出 设备 … 


10. 3.4 计算 机 终端 … 









183 


183 


193 


196 


196 
196 
197 
199 
199 
200 
201 


206 


208 
209 
209 


… 210 


210 


212 
214 
217 


下 放 内 容 水 是 和 学 可 汶 计 建议 oom 


习题 与 思考 题 … 


第 11 章 


11.1 
i.2 


11.3 


11.4 


本 章 内 容 小 结 和 学 习 方 法 建议 … 


输入 输出 系统 


计算 机 输入 输出 系统 概述 … 
计算 机 总 线 … 。 
总 线 概述 … 
总 线 结 构 …… 


Nm NMPN 


输入 输出 接口 








11.4.5 外 围 处 理 机 方式 … 


习题 与 思考 题 … 


第 12 章 
| 


12.2 


12.3 


流 求 瞬 芒 涩 dove 


i 各 扩 坟 绕 的 玫 永 汶 守 2 
… 254 
… 257 
.… 257 
12.2.2 ”流水线 的 加 速 比 esnen 
A 谣 林 苞 的 效率 Ar 
a 访 末 交 的 最 杆 攻 拔 人 坝 和 
BDLX 指 令 集 与 DLX 流水 线 enon ein mm ini 
Uh 
二 商 坟 交 一 条 有 有 痢 村 天 


12.1.4 流水 线 的 分 类 方法 … 
流水 线 的 性 能 指标 ……… 
12.2.1 流水 线 的 吞吐 率 … 









1 
2 
.6 证 


.3.1 输入 输出 接口 的 功能 … 
11.3.2 通用 可 编程 接口 组 成 … 
1.3.3 输入 输出 接口 举例 .pp 
11.41 裕 序 年 接 按 简 浪 式 sedid one Db de 
rh 六 市 所 入 类 鹿 戈 Re 抽 证 让 训 仙 全 全 全 的 关 风 
11.4.3 直接 存储 器 访问 方式 和 
… 247 
… 247 
… 248 











221 


“ 222 


… 223 


… 223 
… 224 
… 224 
… 226 


227 
228 
230 
232 


… 238 
… 238 
239 


239 
242 
242 
243 
245 
247 


250 


250 
250 
252 
253 


260 
260 
261 
261 
261 
266 





计算 机 组 成 与 体系 结构 (第 3 版) 





12.4 


12.5 


和 
流水 线 中 的 相关 问题 e056e0setesnsern errr 271 
2.4.2 数据 相关 … … 273 
2.4.3 控制 相关 … .. 279 
指令 级 并 行 技术 …… … 284 
2. 5.1 基本 概念 … .. 284 
2.5.2 多 指令 发 射 技术 … … 284 








本 章 内 容 小 结 和 学 习 方法 建议 … 7 
习题 与 思考 题 … ONE? 


第 13 章 


13. 2 


13. 3 


13. 4 


13.5 


本 章 内容 小 结 和 学 习 方 法 建议 - 
习题 与 思考 题 ………… ee 


a 


13.1.1 计算 机 体系 结构 的 发 展 … 
13.1.2 计算 机 体系 结构 的 分 类 … 
13.1.3 ”并行 计 算 机 体系 结构 分 类 .pp 292 
并 行 计 算 机 系统 的 设计 间 题 和 pp 293 
13. 2.1 并 行 计 算 机 系统 的 互联 网 络 .ppppp 93 
i132 半生 计算 机 过 蚁 的 往 骨 问题 (nn 98 
| 并 行 计算 机 系统 的 软件 问题 eee eenteee enimensnmen nie 300 
18.3; 1 orp … 301 
13.3.2 向 量 处 理 机 …… … 302 

共享 内 存 的 多 处 理 机 系统 … … 304 
13.4.1 一 致 性 内 存 访 问 的 UMA 多 处 理 机 系统 … 05 
13.4.2 非 一 致 性 内 存 访 问 的 NUMA 多 处 理 机 系统 … eps SO 
13.4.3 基于 Cache 内 存 访问 的 COMA 多 处 理 机 系统 ， :zesxaannan B12 
基于 消息 传递 的 多 计算 机 系统 … a Sn 











317 





计算 机 系统 概述 


本 章 首先 介绍 计算 机 系统 的 基本 组 成 和 它 的 层次 结构 ,使 读者 从 层次 的 观点 ,初步 认识 
完整 计算 机 系统 硬件 与 软件 的 基本 组 成 ,重点 集中 到 计算 机 硬件 的 5 个 功能 部 件 各 自分 担 
的 功能 及 其 相互 的 连接 关系 。 接 下 来 初步 讨论 计算 机 系统 主要 的 性 能 和 技术 指标 。 之 后 对 
计算 机 硬件 子 系统 的 3 部 分 知识 , 即 计算 机 的 体系 结构 .计算 机 组 成 和 计算 机 实现 进行 说 
明 , 指 明 它们 之 间 的 联系 与 区 别 , 帮 助 读 者 把 握 学 习 本 门 课程 的 主 脉络 。 最 后 是 计算 机 的 发 
展 过 程 ,计算 机 系统 的 分 类 和 推广 应 用 的 状况 。 

本 章 作为 学 习 计算 机 组 成 原理 和 体系 结构 课程 的 引导 人 性 的 提纲 ,介绍 了 计算 机 系统 中 
的 某 些 基本 概念 和 常用 术语 ,希望 读者 能 够 从 硬件 和 软件 、 整 机 和 部 件 、 知 识 和 能 力 等 多 种 
对 应 关系 的 角度 来 提高 自己 的 学 习 效 率 。 


1.1 计算 机 系统 的 基本 组 成 及 其 层次 结构 


计算 机 系统 (Computer System) 是 指 电子 数字 通用 计算 机 系统 ,3 个 定语 各 自 表明 了 计 
算 机 系统 的 一 个 方面 的 特性 。“ 电 子 ” 一 词 表明 使 用 电子 线路 (不 同 于 机 械 、 继 电器 等 ) 来 实 
现 计算 机 硬件 的 关键 逻辑 功能 ;“ 数 字 ” 一 词 表明 使 用 的 电子 线路 是 数字 式 电 路 (不 同 于 模拟 
电路 ) ,运算 和 处 理 的 数据 是 二 进 制 的 离散 数据 (不 同 于 连续 的 电压 或 者 电流 量 ); “通用 "一 
词 表 明 计 算 机 本 身 的 功能 多 样 性 (不 是 专用 于 某 种 特定 功能 ), 具 有 完成 各 种 运算 或 事物 处 
理 的 能 力 。 

完整 的 计算 机 系统 由 硬件 (Hardware) 和 软件 (Software) 两 大 部 分 (两 类 资源 ) 组 成 。 
计算 机 的 硬件 系统 是 计算 机 系统 中 看 得 见 、 摸 得 着 的 物理 设备 ,是 一 种 高 度 复杂 的 、 由 多 种 
电子 线路 ,精密 机 械 装置 等 构成 的 .能 自动 并 且 高 速 地 完成 数据 计算 与 处 理 的 装置 或 者 工 
具 。 计 算 机 的 软件 系统 是 计算 机 系统 中 的 程序 和 相关 数据 ,包括 完成 计算 机 资源 管理 ,方便 
用 户 使 用 的 系统 软件 (厂家 提供 ) 和 完成 用 户 对 数据 的 预期 处 理 功能 的 用 户 软件 (用 户 设计 
并 自己 使 用 ?这样 两 大 部 分 。 软 硬件 二 者 相互 依存 ,分工 互动 , 缺 一 不 可 ,硬件 是 计算 机 系统 
中 保存 与 运行 软件 程序 的 物质 基础 ,软件 则 是 指挥 硬件 完成 预期 功能 的 智力 部 分 ,正如 同一 
个 健全 和 健康 的 人 一 样 .必须 同时 具备 物质 性 的 肉体 和 精神 性 的 智力 与 思维 。 

若 进一步 深入 分 析 , 还 可 以 通过 6 个 层次 来 认识 计算 机 硬件 和 软件 系统 的 组 成 关系 ,如 
图 1.1 所 示 。 最 下 面 的 2 层 属于 硬件 内 容 , 最 上 面 的 3 层 属于 软件 内 容 , 中 间 的 指令 系统 层 
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连接 硬件 和 软件 两 部 分 ,与 两 部 分 都 有 密切 关系 。 
从 图 1.1 中 可 以 看 出 ,计算 机 系统 具有 6 层 结构 。 在 不 同 层次 之 间 的 关系 表现 为 以 下 
两 个 方面 。 
(1) 处 在 上 面 的 一 层 是 在 下 一 层 的 基础 上 实现 出 来 的 ， 



































它 实现 的 功能 更 强大 ,也 就 是 说 ,更 接近 人 解决 问题 的 思维 方 Wal 

式 和 处 理 问题 的 具体 过 程 ,对 使 用 人 员 更 方便 ,使 用 这 一 层 提 | 

供 的 功能 时 ,不 必 关心 其 下 一 层 的 实现 细节 。 4: 汇编 语言 层 
(2) 处 在 下 面 的 一 层 是 实现 上 一 层 的 基础 ,更 接近 计算 人 

机 硬件 实现 的 细节 , 它 实现 的 功能 相对 简单 ,人 们 使 用 这 些 功 3: 操作 系统 层 

能 更 感到 困难 。 在 实现 这 一 层 的 功能 时 ,可 能 尚 无 法 全 面 了 

解 其 上 一 层 的 最 终 目标 和 将 要 解决 的 问题 ,也 不 必 理 解 其 更 2 指令 系统 层 

下 一 层 实现 中 的 有 关 细 节 问 题 ,只 要 使 用 下 一 层 所 提供 出 来 

的 功能 来 完成 本 层次 的 功能 处 理 即 可 。 1: 微 体系 结构 层 
采用 这 种 分 层次 的 方法 来 分 析 和 解决 某 些 问题 ,有 利于 

简化 处 理 问 题 的 难度 ,在 某 一 段 时 间 , 在 处 理 某 一 层 中 的 问题 0 就 字 加 济 避 











时 ,只 需 集中 精力 解决 本 层 最 需要 关心 的 核心 问题 即 可 ,而 不 
必 牵 扯 各 上 下 层 中 的 其 他 问题 。 例 如 ,在 用 高 级 语言 设计 程 ”图 1 1 计算 机 系统 层次 结构 
序 时 ,无 须 深入 了 解 各 低层 的 内 容 。 

(1) 第 0 个 层次 是 数字 逻辑 层 ,着 重 体现 实现 计算 机 硬件 的 最 重要 的 物质 材料 是 电子 
线路 ,能 够 直接 处 理 离散 的 数字 信号 。 设 计 计算 机 硬件 的 基础 知识 就 是 数字 逻辑 和 数字 门 
电路 ,解决 的 基本 问题 包括 : 使 用 何 种 线路 和 如 何 存储 信息 ,使 用 何 种 线路 和 如 何 传送 信 
息 , 使 用 何 种 线路 和 如 何 运算 与 加 工 信 息 等 方面 。 这 一 部 分 属于 计算 机 组 成 原理 预备 性 的 
知识 。 

(2) 第 1 个 层次 是 微 体系 结构 (Micro Architecture) 层 ,也 称 其 为 计算 机 裸 机 。 计 算 机 
的 核心 功能 是 执行 程序 ,程序 是 按 一 定 规则 和 顺序 组 织 起 来 的 指令 序列 。 这 个 层次 着 重 体 
现 的 是 ,为 了 执行 指令 ,需要 在 计算 机 中 设置 哪些 功能 部 件 (例如 存储 运算 ,输入 和 输出 , 接 
口 和 总 线 等 部 件 ,当然 还 有 更 复杂 一 点 的 控制 器 部 件 ) ,每 个 部 件 具体 如 何 组 成 和 怎样 运行 ， 
这 些 部 件 如 何 实现 相互 连接 并 协同 工作 等 方面 的 知识 和 技术 。 计 算 机 硬件 系统 通常 由 运算 
器 部 件 (数据 通路 ) ,控制 器 部 件 . 存 储 器 部 件 、 输 入 设备 和 输出 设备 这 5 个 部 分 组 成 ,这 些 部 
分 是 计算 机 组 成 原理 的 主要 内 容 。 

(3) 第 2 个 层次 是 指令 系统 (Instruction Set) 层 , 介 于 硬件 和 软件 之 间 。 它 涉及 需要 确 
定 使 用 哪些 指令 ;指令 能 够 处 理 的 数据 类 型 和 对 各 种 类 型 数据 可 以 执行 的 运算 ;每 一 条 指令 
的 格式 和 实现 的 功能 ;如 何 指出 想 要 对 其 执行 读 操作 或 者 写 操作 的 存储 器 的 一 个 存储 单元 
如 何 指出 想 要 执行 输入 或 者 输出 操作 的 一 个 外 围 设备 ;对 哪些 数据 进行 运算 ,执行 哪 一 种 运 
算 ; 如 何 保存 计算 结果 等 。 指 令 系统 是 计算 机 硬件 系统 设计 、 实 现 的 最 基本 和 最 重要 的 依 
据 , 与 计算 机 硬件 实现 的 复杂 程度 .设计 程序 的 难 易 程度 .程序 占用 硬件 资源 的 多 少 、 程 序 运 
行 的 效率 等 都 直接 相关 。 也 就 是 说 ,硬件 系统 就 是 要 实现 每 一 条 指令 的 功能 ,能 够 直接 识别 
和 执行 由 指令 代码 组 成 的 程序 。 当 然 ,指令 系统 与 计算 机 软件 的 关系 也 十 分 密切 ,指令 是 用 
于 设计 程序 的 。 节 省 硬件 资源 和 有 利于 提高 程序 运行 效率 是 对 指令 系统 的 主要 要 求 。 在 计 
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算 机 内 部 ,全 部 的 程序 最 终 都 由 指令 系统 所 提供 的 指令 代码 组 成 ,计算 机 硬件 能 够 直接 识别 
和 执行 的 只 能 是 由 指令 代码 组 成 的 程序 。 一 台 计 算 机 的 指令 系统 对 计算 机 厂家 和 用 户 来 说 
都 是 很 重要 的 事情 ,需要 非常 认真 仔细 地 分 析 和 对 待 。 指 令 系 统 设计 属于 计算 机 系统 结构 
的 范围 ,合理 选择 可 用 的 线路 实现 每 一 条 指令 的 功能 则 是 计算 机 组 成 的 主要 任务 。 

(4) 第 3 个 层次 是 操作 系统 (Operating System) 层 。 它 是 计算 机 系统 中 最 重要 的 软件 ， 
主要 负责 计算 机 系统 中 的 资源 管理 与 分 配 , 以 及 向 使 用 者 和 程序 设计 人 员 提 供 简单 方便 、 
高 效 的 服务 。 一 套 计 算 机 系统 中 包含 了 大 量 高 价 的 .管理 和 使 用 相当 复杂 的 硬件 资源 和 软 
件 资源 。 不仅 一 般 水 平 的 使 用 人 员 , 就 是 水 平 很 高 的 专业 人 员 都 难以 直接 控制 和 操作 ,因此 
把 资源 管理 和 调度 功能 留 给 计算 机 系统 本 身 来 完成 更 可 靠 , 这 些 功能 是 由 操作 系统 承担 的 。 
操作 系统 还 为 使 用 计算 机 的 用 户 提供 了 许多 支持 , 它 与 程序 设计 语言 相 结合 ,使 得 程序 设计 
更 简单 ,创建 用 户 的 应 用 程序 和 操作 计算 机 也 更 方便 。 它 是 使 用 (直接 或 者 间接 ) 计 算 机 指 
令 系 统 所 提供 的 指令 设计 出 来 的 程序 ,并 把 一 些 常用 功能 以 操作 命令 或 者 系统 调用 的 方式 
提供 给 使 用 人 员 。 也 可 以 说 ,操作 系统 进一步 扩展 了 原来 的 指令 系统 ,提供 了 新 的 可 用 命 
令 , 从 而 构成 一 台 比 起 纯 硬 件 系 统 ( 计 算 机 裸 机 ) 功 能 更 加 强大 的 计算 机 系统 。 操 作 系 统 不 
属于 计算 机 组 成 的 范围 ,在 计算 机 专业 的 教学 安排 中 应 该 设置 这 门 软件 课程 。 

(5) 第 4 个 层次 是 汇编 语言 (Assembly Language) 层 。 计 算 机 是 由 人 指挥 控制 , 供 人 来 
使 用 的 电子 设备 。 使 用 计算 机 的 人 员 要 有 办 法 把 自己 的 意图 告知 给 计算 机 ,为 完成 这 种 “对 
话 ”, 就 需要 使 用 某 种 语言 。 遗 憾 的 是 ,计算 机 还 不 能 (至 少 目 前 尚 不 能 低 成 本 的 实现 ) 听 懂 
人 类 的 自然 语言 ,更 无 法 执行 人 类 自然 语言 的 全 部 命令 。 最 简单 的 解决 办 法 是 让 计算 机 使 
用 它 的 硬件 可 以 直接 识别 .理解 的 ,用 电子 线路 容易 处 理 的 一 种 语言 ,这 就 是 计算 机 的 机 器 
语言 ,又 称 为 二 进 制 代码 语言 ,也 就 是 计算 机 的 指令 。 一 台 计算 机 的 全 部 指令 构成 该 计算 机 
的 指令 系统 (Instruction Set) 。 由 此 可 以 看 出 ,计算 机 的 基础 硬件 实质 上 是 在 机 器 语言 的 层 
次 上 被 设计 与 实现 出 来 的 ,并 且 可 以 直接 识别 和 执行 的 只 能 是 由 机 器 语言 构成 的 程序 。 这 
样 做 的 结果 是 ,计算 机 一 方 的 矛盾 解决 了 ,但 是 使 用 计算 机 的 人 员 却 很 难 接受 并 使 用 这 种 语 
言 。 为 此 ,必须 找 出 一 种 折 中 方案 ,做 到 人 员 使 用 和 计算 机 实现 都 更 容易 一 点 ,这 就 要 用 到 
汇编 语言 和 高 级 程序 设计 语言 以 及 各 种 专用 目的 的 语言 。 

汇编 语言 (Assembly Language) 大 体 上 是 对 计算 机 机 器 语言 的 符号 化 处 理 的 结果 ,再 
增加 一 些 为 方便 程序 设计 而 实现 的 扩展 功能 。 与 机 器 语言 相 比 ,汇编 语言 至 少 有 两 大 优点 。 
首先 实现 用 英文 单词 或 其 缩写 形式 替代 二 进 制 的 指令 代码 ,更 容易 为 人 们 记忆 和 理解 ;其 次 
是 可 以 选用 含义 明确 的 英文 单词 来 表示 程序 中 用 到 的 数据 (常量 和 变量 ), 并 且 避 免 程序 设 
计 人 员 亲 自 花 费 精力 为 这 些 数据 分 配 存储 单元 ,而 是 将 这 些 工 作 留 给 汇编 程序 自己 去 安排 ， 
这 样 的 语言 就 达到 了 实用 的 最 基本 的 标准 。 如 果 在 此 基础 上 ,再 支持 程序 的 不 同 结构 特性 
(如 循环 和 重复 执行 等 结构 ) ,将 子 程序 所 用 哑 变 元 替换 为 真实 参数 等 方面 提供 必要 的 支持 ， 
使 用 这 个 语言 设计 程序 就 更 为 方便 。 因 此 ,汇编 语言 是 面向 计算 机 硬件 本 身 的 ,程序 设计 人 
员 可 以 使 用 的 一 种 计算 机 语言 。 汇 编 语言 的 程序 必须 经 过 一 个 叫 作 汇编 程序 的 系统 软件 的 
翻译 ,将 其 转换 为 计算 机 的 机 器 语言 后 ,才能 在 计算 机 的 硬件 系统 上 子 以 执行 。 由 于 汇编 语 
言 和 机 器 语言 存在 十 分 紧密 的 对 应 关系 ,在 讲授 和 学 习 计 算 机 组 成 原理 课程 时 ,通常 应 使 用 
汇编 语言 来 设计 实例 程序 。 

(6) 第 5 个 层次 是 高 级 语言 层 . 高 级 语言 又 称 算法 语言 (Algorithm Language) , 它 的 实 
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现 思路 不 再 是 过 分 地 * 靠 拢 计算 机 硬件 的 指令 系统 ,而 是 侧重 面向 解决 实际 问题 所 用 的 算 
法 ,更 多 的 是 为 方便 程序 设计 人 员 写 出 自己 解决 问题 的 处 理 方案 和 解 题 过 程 的 程序 。 目 前 
常用 的 高 级 语言 有 CC++ .PASCAL、Java、BASIC 等 。 用 这 些 语言 设计 出 来 的 程序 通常 需 
要 经 过 一 个 叫 作 编译 程序 的 软件 将 其 编译 成 机 器 语言 程序 ,或 者 首先 编译 成 汇编 程序 后 ,再 
经 过 汇编 操作 后 得 到 机 器 语言 程序 ,才能 在 计算 机 的 硬件 系统 上 了 予以 执行 。 也 可 以 由 一 个 
叫 作 解释 执行 程序 的 软件 逐条 取 来 相应 高 级 语言 程序 的 每 个 语句 并 直接 控制 其 执行 过 程 ， 
而 不 是 把 整个 程序 编译 为 机 器 语言 程序 之 后 再 交 给 硬件 系统 加 以 执行 ,解释 执行 程序 的 最 
大 缺点 是 运行 效率 很 低 。 高 级 语言 不 属于 计算 机 组 成 课程 的 范围 。 

在 高 级 语言 层 之 上 ,还 可 以 有 应 用 层 , 由 解决 实际 问题 的 处 理 程序 组 成 ,例如 文字 处 理 
软件 ,数据库 软件 .网 络 软件 .多 媒体 信息 处 理 软件 .办公 自动 化 软件 等 。 但 这 些 内 容 已 经 超 
出 了 本 书 的 讨论 范围 ,不 在 这 里 袭 述 , 换 句 话说 ,计算 机 是 用 于 解决 各 种 应 用 问题 的 系统 ,为 
有 应 用 而 存在 ,通过 处 理 各 种 应 用 问题 而 体现 出 它 的 性 能 和 价值 。 

在 大 部 分 的 教材 中 ,人 们 通常 把 没有 配备 软件 的 纯 硬 件 系 统称 为 “ 裸 机 ”, 这 是 计算 机 系 
统 的 根基 或 称 " 内 核 ”。 它 的 设计 目标 更 多 地 集中 到 方便 硬件 实现 和 有 利于 降低 成 本 两 个 方 
面 , 因 此 提供 的 功能 相对 较 弱 ,只 能 执行 由 机 器 语言 构成 的 程序 ,非常 难以 使 用 。 为 此 ,人 们 
期 望 能 开发 出 功能 更 强 、 更 接近 人 的 思维 方式 和 使 用 习惯 的 语言 ,这 是 通过 在 裸 机 上 配备 适 
当 的 软件 来 完成 的 。 每 加 一 层 软件 就 构成 一 个 新 的 “虚拟 计算 机 ”, 功 能 更 强大 ,使 用 也 更 加 
方便 。 例 如 ,配备 了 操作 系统 之 后 ,就 可 以 通过 操作 系统 的 命令 (Command) 或 者 窗口 上 的 
图 标 方便 地 操作 使 用 这 个 新 的 虚拟 机 系统 ;再 配备 上 汇编 语言 ,用 户 就 可 以 用 它 来 编写 用 户 
程序 ,实现 用 户 预 期 的 处 理 功 能 ;配备 了 高 级 语言 之 后 ,用 户 就 可 以 用 它 来 更 方便 高 效 地 编 
写 程序 ,解决 处 理 规模 更 为 庞大 .逻辑 关系 更 加 复杂 的 问题 。 例 如 ,可 以 把 前 面 说 明 的 计算 
机 系统 中 的 第 1 一 5 层 分 别称 为 裸 机 、Li 虚拟 机 (支持 机 器 语言 )、L 虚拟 机 (增加 了 操作 系 
统 )、L 虚拟 机 (支持 汇编 语言 ) .Ls 虚拟 机 (支持 高 级 语言 ) 。 


1.2 计算 机 硬件 的 5 个 功能 部 件 及 其 功能 


计算 机 系统 的 核心 功能 是 执行 程序 。 为 此 ,首先 必须 有 能 力 把 要 运行 的 程序 和 用 到 原 
始 数 据 输 入 到 计算 机 内 部 并 存储 起 来 , 接 下 来 应 该 有 办 法 逐条 执行 这 个 程序 中 的 指令 以 完 
成 数据 运算 并 得 到 运算 结果 ,最 后 还 要 可 以 把 运算 结果 输出 供 人 检查 和 使 用 。 为 此 ,一 套 计 
算 机 的 硬件 系统 至 少 需要 由 下 述 几 个 相互 连接 在 一 起 的 部 件 和 设备 组 成 ,如 图 1. 2 所 示 。 

在 图 1. 2 中 通过 5 个 方 框图 给 出 了 计算 机 硬件 的 5 个 基本 功能 部 件 。 其 中 的 4 个 部 件 
所 分 担 的 功能 ,通过 方 框 中 的 文字 说 明 已 经 表示 出 来 。 例 如 ,数据 输入 设备 完成 对 程序 和 原 
始 数据 的 输入 功能 ,数据 存储 部 件 完 成 对 程序 和 数据 的 存储 功能 ,数据 运算 部 件 完成 对 数据 
的 运算 处 理 功能 ,结果 输出 部 件 完成 对 运算 处 理 结果 的 输出 功能 。 而 控制 器 部 件 则 是 依照 
每 条 指令 的 运行 功能 的 需要 ,向 各 个 部 件 或 设备 提供 它们 协调 运行 所 需要 的 控制 信号 ,在 整 
个 硬件 系统 中 起 到 指挥 ,协调 和 控制 的 作用 。 

可 以 把 计算 机 想象 为 一 个 加 工 、 处 理 数 据 的 工厂 , 则 数据 运算 部 件 就 是 数据 加 工 车 间 ; 
数据 存储 部 件 就 是 存放 原材料 、 半 成 品 和 最 终 产 品 的 库房 ;输入 设备 相当 于 运 和 原材料 的 运 
货 卡车 ;输出 设备 相当 于 发 出 最 终 产品 的 运 货 卡 车 ;控制 部 件 则 相当 于 承担 领导 指挥 功能 的 
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图 1.2 计算 机 硬件 系统 的 组 成 示意 图 


厂 长 和 各 个 职能 办 公 室 。 在 领导 的 正确 指挥 下 ,如 果 能 够 源源 不 断 地 取得 原材料 ,工厂 内 又 
有 存放 的 场所 ,车 间 能 够 对 这 些 原材料 进行 指定 的 加 工 处 理 , 加 工 后 的 产品 可 以 畅通 地 运 出 
去 销售 , 则 这 个 工厂 (计算 机 ?就 纳入 正常 运行 的 轨道 。 
图 1.2 中 上 面 标记 为 部 件 的 3 个 组 成 部 分 通常 是 使 用 电子 线路 实现 出 来 的 ,安装 在 一 
个 金属 机 柜 内 或 者 印 制 电路 板 上 ,被 称 为 计算 机 的 主机 。 左 边 的 数据 运算 部 件 和 计算 机 控 
制 部 件 合 称 为 计算 机 的 中 央 处 理 器 (Center Processing Unit, CPU), 又 称 为 处 理 机 
(Processor) 。 
图 1.2 中 下 面 标记 为 设备 的 2 个 组 成 部 分 通常 是 使 用 精密 机 械 装 置 和 电子 线路 共同 制 
作出 来 的 ,也 可 以 合 称 为 输入 输出 设备 ,又 称 为 计算 机 的 外 围 设备 。 
图 1.2 中 的 中 间 是 计算 机 的 3 种 类 型 的 总 线 。 数 据 总 线 用 于 在 这 些 部 件 或 设备 之 间 传 
送 属于 数据 信息 (指令 和 数据 ) 的 电气 信号 :地址 总 线 用 于 在 这 些 部 件 或 设备 之 间 传 送 属 于 
地 址 信息 的 电气 信号 ,以 选择 数据 存储 部 件 中 的 一 个 存储 单元 ,或 者 外 围 设备 中 的 一 个 设 
备 ;控制 总 线 用 于 向 存储 部 件 和 外 围 设备 传送 起 控制 作用 的 电气 信号 ,也 就 是 指定 在 CPU 
和 这 些 部 件 或 者 设备 之 间 数 据 传送 的 方向 以 及 操作 的 性 质 ( 读 操作 还 是 写 操作 ) 等 。 请 注 
意 ,CPU 和 输入 输出 设备 通常 并 不 是 直接 通过 总 线 相互 连接 起 来 ,需要 经 过 一 个 叫 作 接口 
的 电路 完成 连接 ,这 有 利于 降低 CPU 和 设备 之 间 的 耦合 强度 ,增强 整 机 系统 构成 的 灵活 
性 。 可 以 看 出 ,计算 机 的 5 个 功能 部 件 正 是 通过 这 3 种 类 型 的 总 线 以 及 接口 被 有 机 地 连接 
在 一 起 ,从 而 构成 一 台 完 整 的 .可 以 协调 运行 (执行 程序 ) 的 计算 机 硬件 系统 。 

在 计算 机 中 ,普遍 的 体系 结构 是 由 汉 “ 诺 依 曼 先生 提出 来 的 被 称 为 存储 程序 的 计算 机 ， 
即 可 以 把 指令 和 数据 用 二 进 制 代码 形式 保存 到 存储 器 中 ,并 通过 地 址 顺序 访问 。 计 算 机 由 
承担 数据 运算 .数据 存储 、 输 入 和 输出 、 整 机 系统 控制 等 功能 的 部 件 组 成 。 早 期 计算 机 的 几 
个 部 件 是 围绕 着 运算 器 部 件 来 组 织 的 ,如 图 1. 3(a) 所 示 方 案 。 其 特点 是 在 存储 器 和 输入 输 
出 设备 之 间 传 送 数据 都 需要 经 过 运算 器 。 在 当前 流行 的 计算 机 中 ,更 常用 的 方案 则 是 围绕 
着 存储 器 部 件 来 组 织 ,如 图 1. 3(b) 所 示 方 案 。 方 案 (b) 和 方案 (a) 相 比 ,并 无 实质 性 的 区 别 ， 
只 是 在 一 些小 的 方面 做 了 部 分 改进 ,使 输入 输出 操作 尽 可 能 地 绕 过 CPU ,直接 在 输入 输出 
设备 和 存储 器 系统 之 间 完 成 ,以 提高 系统 的 整体 运行 性 能 。 

前 面 说 到 的 还 只 限于 “工厂 的 硬件 ?组 成 ,也 就 是 人 员 和 厂房 设备 等 , 仅 有 这 些 ,工厂 还 
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图 1.3 计算 机 的 组 成 结构 


是 运转 不 起 来 的 ,至 少 是 很 难 运行 的 。 要 成 功 运 转 , 还 需要 有 一 系列 的 规章 制度 、 管 理 策略 
和 经 营办 法 等 “软件 "部 分 。 计 算 机 系统 也 一 样 , 在 硬件 组 成 的 基础 之 上 ,还 必须 有 它 的 软件 
部 分 。 其 主要 包括 操作 系统 ,程序 设计 语言 及 其 支持 软件 等 ,这 些 在 前 面 已 经 提 到 。 

如 表 1.1 所 示 , 以 计算 从 1 到 10 的 累加 和 为 例 ,看 一 看 3 个 级 别 语言 的 程序 例子 ,并 简 
单 介 绍 该 机 器 语言 程序 在 计算 机 内 部 的 执行 过 程 。 下 面 的 程序 可 以 在 一 个 模拟 软件 中 实际 
运行 。 


表 1.1 3 个 级 别 的 语言 比较 

















高 级 语言 BASIC 的 程序 汇编 语言 的 程序 机 器 语言 的 程序 (十 六 进 制 表示 ) 
10 sum=0 2000: sub R15, R15 01FF 
20 for i=1 to 10 sub Rl, RI1 0111 
30 sum 一 sum 十 i mvrd R0 .0A 8800 000A 
40 next i inc RI1 0910 
50 print sum add R15.R1 00F1 
60 end cmp Rl, RO 0310 
jrnz 2004 47FC 
cala 0664 CE00 0064 
ret 8F00 
每 个 BASIC 语句 带 数 字 标 号 ,用 于 | 设计 汇编 语言 程序 要 懂得 计算 | 机 器 语言 程序 是 计算 机 指令 代 
表明 语句 次 序 关 系 , 用 高 级 语言 设 | 机 硬件 的 某 些 特性 ,要 自己 安 | 码 的 序列 ,很 难 记忆 指令 代码 并 
计 程 序 , 重 点 关注 运算 功能 而 不 是 | 排 通用 寄存 器 和 内 存 地 址 等 ,| 用 其 设计 程序 ,每 个 基本 汇编 语 
计算 机 硬件 组 成 及 使 用 ,很 方便 比较 烦琐 、 复 杂 ,工作 效率 低 句 对 应 一 条 指令 


机 器 码 程序 的 执行 过 程 为 : 首先 把 机 器 语言 的 程序 用 输入 设备 输入 到 计算 机 的 存储 器 
中 ,例如 从 十 六 进 制 的 2000 地 址 单元 开始 依次 存放 每 一 条 指令 。 用 操作 系统 (监控 程序 ) 的 
命令 运行 这 个 程序 , 则 CPU 将 从 程序 的 首 地 址 (2000) 到 存储 器 读 来 第 一 条 指令 并 保存 到 
控制 器 中 , 接 下 来 依据 指令 功能 指挥 各 部 件 完成 必要 操作 。 例 如 第 1 条 就 是 控制 运算 器 完 
成 一 次 减法 运算 ,与 此 同时 形成 下 一 条 指令 的 地 址 , 待 本 条 指令 完成 后 ,用 这 个 地 址 去 读 下 
一 条 指令 ,继续 执行 ,直到 程序 的 最 后 一 条 指令 。cala 语句 调用 子 程序 .把 R15 中 的 累加 和 
显示 到 屏幕 上 。 
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1.3 计算 机 系统 主要 的 技术 与 性 能 指标 


这 里 只 是 从 整 机 的 角度 介绍 计算 机 系统 的 某 些 技术 与 性 能 指标 ,突出 几 个 重要 概念 和 
基本 术语 ,而 把 涉及 各 个 部 件 的 更 具体 的 指标 安排 到 其 他 相应 的 章节 中 介绍 。 

1. 计算 机 字 长 

从 物理 上 容易 实现 和 数据 运算 规则 简单 进行 考虑 ,现代 的 计算 机 普遍 使 用 二 进 制 , 即 每 
一 位 上 的 数值 只 有 0 和 1 两 个 值 , 相 邻 数位 之 间 采 用 "* 逢 二 进 1? 的 规则 处 理 ,用 从 右 到 左 依 
次 排列 起 来 的 一 串 二 进 制 的 数 表示 不 同 的 数值 和 信息 。 

在 计算 机 系统 内 部 ,通常 选用 多 少 个 二 进 制 位 来 表示 一 个 数据 或 一 条 指令 是 一 个 关键 
技术 指标 ,例如 16 .32 或 者 64 位 ,这 个 位 数 被 称 为 计算 机 字 长 。 现 代 计 算 机 的 字 长 通常 都 
被 设计 为 8 的 整数 倍 。 如 在 32 位 字 长 的 计算 机 系统 中 ,一 个 整数 ,一 条 指令 通常 都 用 32 位 
二 进 制 数 表示 , 叫 作 一 个 字 ,运算 器 ,存储 器 .数据 和 地 址 总 线 等 通常 都 被 设计 成 32 位 。 字 
长 对 计算 机 的 处 理 能 力 和 运行 性 能 有 明显 影响 , 字 长 较 长 有 利于 提高 计算 机 的 性 能 ,但 需要 
使 用 更 多 的 硬件 ,计算 机 系统 的 价格 也 会 高 一 些 。 

2. CPU 速度 

衡量 CPU 速度 ,通常 有 两 种 方式 。 

第 一 种 方式 是 使 用 CPU 主 频 , 即 CPU 系统 使 用 的 时 钟 脉冲 的 频率 (每 一 秒 提供 的 时 
钟 脉冲 的 个 数 称 为 赫兹 (Hz) .10" Hz 二 1MHz,10”Hz 二 1GHz) 来 表示 ,例如 500MHz。 对 同 
一 个 型 号 的 计算 机 ,其 主 频 越 高 ,完成 指令 的 一 个 执行 步骤 所 用 的 时 间 越 短 , 执 行 指令 的 速 
度 越 快 。 但 对 不 同 厂家 、 不 同系 列 的 计算 机 系统 ,只 用 CPU 主 频 来 说 明 其 运行 速度 则 未 必 
准确 。 

第 二 种 方式 是 使 用 CPU 每 一 秒 能 执行 的 指令 条 数 ,单位 是 MIPS(Million Instructions 
Per Second) ,其 计算 公式 可 以 通过 如 下 方式 推导 出 来 。 

T=CPIXTICXT 

这 里 的 工 是 执行 一 个 程序 占用 的 全 部 时 间 ,CPI 是 执行 一 条 指令 平均 使 用 的 CPU 时 
钟 个 数 ,T_IC 是 一 个 CPU 时 钟 的 时 间 长 度 , 是 CPU 主 频 f 的 倒数 1/f,T 是 这 个 程序 的 指 
令 条 数 ,3 个 数值 的 乘积 就 等 于 这 个 程序 总 的 运行 时 间 TT。 由 此 得 到 : 

I= T/(CPIX1/f) = Tx f/CPI 

这 个 公式 表明 ,单位 时 间 内 执行 的 指令 条 数 正比 于 CPU 的 时 钟 频率 /, 这 个 频率 的 高 
低 取决 于 计算 机 的 实现 技术 、 生 产 工艺 和 计算 机 组 成 ;反比 于 每 条 指令 的 执行 步 又 数目 。 它 
反映 计算 机 的 实现 技术 、 计 算 机 指令 系统 的 结构 和 计算 机 组 成 ;一 个 程序 的 指令 条 数 还 与 计 
算 机 指令 系统 的 结构 和 编译 技术 有 关系 。 

当 取 T= 二 1s, 并 假定 了 为 300MHz,CPI 为 4. 则 计算 出 该 CPU 系统 的 性 能 为 300/4, 等 
于 75 个 MIPS, 即 每 秒 执行 75 个 百 万 条 指令 。 若 有 办 法 使 这 台 计 算 机 的 CPI 尽量 靠近 1， 
则 其 运行 性 能 就 可 以 提高 近 4 倍 ,这 正 是 精简 指令 系统 计算 机 (RISC) 所 追求 的 目标 。 





若 进一步 细 化 ,可 以 写 出 计算 CPI 的 公式 为 CPI 二 Dery, X I/T, 这 里 的 是 指令 的 
种 类 ,CPL 是 每 类 指令 的 执行 步骤 数 , 1/T 表示 在 程序 中 这 类 指令 数目 与 总 指令 数目 的 比 
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例 。 这 种 通过 引入 不 同 指令 在 程序 中 出 现 的 频率 来 计算 加 权 CPI 的 方法 ,更 符合 计算 机 系 
统 运行 的 真实 性 能 。 

由 于 在 计算 机 中 用 于 计算 整数 的 指令 和 计算 浮 点 数 (实数 ) 的 指令 执行 速度 差异 较 大 ， 
不 同 程序 中 这 两 类 指令 所 占 的 比例 也 有 很 大 不 同 ,所 以 在 许多 场合 下 ,人 们 分 别 用 MIPS 和 
MFLOPS 描述 整数 指令 和 浮 点 数 指令 的 执行 速度 ,以 对 比 不 同 计算 机 系统 的 CPU 性 能 
求 平 。 

3. 存储 容量 

计算 机 中 的 存储 器 通常 包括 内 存储 器 和 外 存储 器 两 大 类 。 内 存储 器 又 被 称 为 主 存储 
器 ,通常 用 半导体 器 件 实现 。 其 读 写 速度 快 ,价格 较 高 ,通常 容量 要 小 一 些 ,可 供 CPU 通过 
指令 直接 访问 。 断 电 后 随机 读 写 的 存储 器 (RAM) 原 保存 的 信息 将 丢失 ,只 读 存储 器 
(ROM) 中 的 信息 将 保持 不 变 。 外 存储 器 又 称 辅助 存储 器 、 海 量 存 储 器 等 ,主要 包括 磁盘 设 
备 .光盘 设备 、 磁 带 设备 等 。 通 常 是 在 机 械 旋转 或 移动 的 盘 片 . 磁 带 上 设置 一 层 记 录 信 息 的 
物质 ,用 磁化 、 改 变 反 射 光 强度 的 方式 写 和 或 读 出 二 进 制 的 信息 , 读 写 速度 要 慢 得 多 ,价格 较 
低 ,容量 很 大 。 外 存储 器 上 的 信息 需要 经 过 操作 系统 成 批量 地 (而 不 是 以 字 为 单位 ) 与 内 存 
储 器 进行 交换 。 外 存储 器 中 的 信息 在 断 电 后 不 会 丢失 ,在 脱 机 的 状态 下 也 可 以 长 期 保存 。 
存储 器 的 容量 ,通常 情况 下 用 字 节 (Byte) 表 示 ,32 位 的 字 由 4 个 字 节 组 成 。 存 储 器 的 容量 
大 ,所 存储 的 信息 量 就 越 大 ,计算 机 运行 的 速度 就 可 能 更 快 ,相应 的 硬件 成 本 也 会 更 高 。 

目前 计算 机 的 内 存 容量 为 几 十 、 几 百 兆 字 节 , 甚 至 几 十 ,上 百 吉 字 节 。 外 存储 器 的 容量 
一 般 是 几 十 、 几 百 吉 字 节 ,采用 阵列 技术 则 可 以 得 到 容量 更 大 的 (例如 几 十 ,上 千 太 字 节 ， 
1TB 二 10*B) 外 存储 器 系统 。 

4. 内 存储 器 的 存 取 周 期 和 外 存储 器 的 数据 传送 速率 

内 存储 器 的 读 写 周期 是 指 启 动 连续 的 两 次 读 写 操作 所 必需 的 时 间 间 隔 , 通 常 都 比较 短 。 
当前 的 内 存储 器 存 取 周 期 为 几 十 个 纳 秒 到 一 两 百 个 纳 秒 (ns) , 读 写 速度 快 的 存储 器 价格 要 
贵 一 些 ,要 合理 选用 。 外 存储 器 会 涉及 机 械 运动 ,找到 要 读 写 的 数据 在 硬 磁盘 中 的 位 置 通常 
需要 几 十 到 十 几 个 毫秒 (ms) ,一 次 读 出 几 百 个 字 节 的 信息 通常 需要 若干 毫秒 ,而 连续 读 出 
一 批 数 据 平均 到 每 个 信息 上 的 读 出 时 间 可 以 更 短 。 通 常 把 单位 时 间 内 可 以 对 磁盘 设备 读 写 
的 数据 数量 称 为 设备 的 传输 速率 ,例如 磁盘 设备 的 传输 速率 可 以 达到 几 十 到 几 百 兆 字 节 每 
秒 (MB/s)。 外 存 设备 的 传输 速率 是 影响 计算 机 系统 性 能 的 一 个 重要 因素 ,特别 是 作为 服务 
器 之 类 的 计算 机 更 是 如 此 。 这 个 速率 不 仅 与 设备 本 身 的 性 能 有 关 , 与 设备 的 接口 性 能 和 计 
算 机 总 线 设计 也 直接 相关 。 在 使 用 磁盘 阵列 技术 之 后 ,其 传输 速率 可 以 得 到 大 幅度 提高 。 

5. 输入 输出 设备 的 入 出 速度 

计算 机 的 输入 输出 设备 是 计算 机 系统 中 比较 复杂 的 部 分 。 其 组 成 和 运行 原理 各 不 相 
同 , 与 计算 机 主机 的 连接 与 控制 方式 也 有 很 大 差异 。 在 电子 线路 之 外 还 涉及 精密 机 械 、 光 
学 激光、 电磁 转换 等 许多 知识 。 不 同 的 输入 输出 设备 的 运行 速度 各 不 相同 ,例如 针 式 打印 
机 每 秒 只 能 打印 几 个 字符 ,而 激光 打印 机 则 可 以 打印 多 行 甚至 几 页 打印 纸 的 信息 ,键盘 输入 
则 主要 取决 于 人 员 打字 的 速度 。 显 示 器 的 屏幕 大 小 .分辩 率 高 低 、. 显 示 字 符 还 是 图 形 的 不 同 
内 容 .屏幕 刷新 频率 等 都 对 系统 性 能 有 重要 影响 。 

通常 还 需要 关注 计算 机 内 部 的 并 行 处 理 能 力 。 一 个 部 件 通常 一 次 只 能 完成 一 项 功能 ， 
若 同 时 设置 两 个 部 件 , 则 它们 就 可 以 同时 各 自 完成 一 项 功能 ,这 被 称 为 并 行 处 理 , 是 提高 计 
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算 机 系统 性 能 的 重要 途径 之 一 。 例 如 ,运算 器 中 可 以 设置 两 个 完成 整数 运算 的 定点 运算 器 ， 
控制 器 可 以 控制 多 条 指令 并 行 执行 ;内 存储 器 可 以 被 划分 成 多 个 可 以 并 行 读 写 的 存储 体 ; 可 
以 使 用 多 个 可 以 并 行 读 写 的 磁盘 构成 一 个 磁盘 阵列 ;在 一 个 计算 机 系统 中 设置 多 个 CPU; 
使 用 多 台 计 算 机 系统 协同 执行 一 项 大 型 的 计算 任务 等 。 也 可 以 通过 分 时 的 办 法 使 几 个 软件 
程序 并 行 运行 。 软 硬件 的 并 行 处 理 能 力 是 计算 机 系统 结构 重点 研究 的 问题 ,会 反映 到 计算 
机 组 成 中 来 ,但 不 属于 计算 机 组 成 原理 课程 的 基本 教学 内 容 。 


1.4 计算 机 的 体系 结构 .组 成 和 实现 概述 


在 讲解 计算 机 硬件 系统 时 ,通常 会 涉及 计算 机 体系 结构 .计算 机 组 成 和 计算 机 实现 这 3 
个 既 有 联系 又 有 区 别 的 不 同 概念 。 它 们 各 自 处 理 和 解决 的 问题 不 尽 相同 ,下 面 对 此 进行 简 
要 介绍 ,并 结合 设计 实现 教学 实验 计算 机 系统 处 理 的 某 些 问题 做 一 些 补充 说 明 。 

计算 机 体系 结构 (Computer Architecture) 通 常 是 指使 用 机 器 语言 或 者 汇编 语言 的 程序 
设计 人 员 所 见 到 的 计算 机 系统 的 属性 , 即 计算 机 的 使 用 特性 ,是 计算 机 系统 的 概念 性 结构 及 
其 功能 特性 。 这 其 中 的 许多 问题 都 直接 和 计算 机 的 指令 系统 有 关 , 例 如 计算 机 的 字 长 ,指令 
类 别 ,格式 和 功能 ,支持 的 寻 址 方式 ,指令 系统 的 构成 ,计算 机 硬件 能 够 直接 识别 和 处 理 的 数 
据 类 型 及 其 表示 ,存储 、 读 写 方式 ,指令 中 使 用 的 寄存 器 数量 和 表示 方法 ,存储 器 、 输 入 输出 
设备 和 CPU 之 间 数 据 传送 的 方式 和 控制 ,也 包括 中 断 的 类 型 和 处 理 流程 ,系统 中 对 各 类 信 
息 的 保护 ,计算 机 的 运行 状态 的 定义 和 切换 ,对 各 种 运行 异常 或 者 出 错 的 检测 和 处 理 方案 
等 。 这 些 都 是 程序 设计 人 员 编 写 出 高 质量 程序 并 确保 其 正常 运行 必须 深入 了 解 的 计算 机 的 
属性 。 计 算 机 体系 结构 主要 研究 硬件 和 软件 功能 的 划分 ,确定 硬件 和 软件 的 界线 , 即 哪些 功 
能 应 划分 给 硬件 子 系统 完成 ,哪些 功能 应 划分 到 软件 子 系统 中 实现 。 

计算 机 组 成 (Computer Organization) 是 在 确定 了 硬件 子 系统 的 概念 结构 和 功能 特性 的 
基础 上 ,设计 计算 机 各 部 件 的 具体 组 成 .它们 之 间 的 连接 关系 ,实现 机 器 指令 级 的 各 种 功能 
和 特性 。 从 这 一 点 又 可 以 说 ,计算 机 组 成 是 计算 机 体系 结构 的 逻辑 实现 。 为 了 实现 相同 的 
计算 机 体系 结构 所 要 求 的 功能 ,完全 可 以 有 多 种 不 同 的 计算 机 组 成 设计 方案 。 半 导体 器 件 
性 能 的 提高 ,新 的 技术 成 果 的 面世 ,新 的 价格 和 性 能 比 的 需求 出 现 , 都 会 带 来 计算 机 组 成 的 
变化 。 在 这 个 方面 最 突出 的 例子 ,就 是 系列 计算 机 (Family Computer) 的 出 现 和 它 的 极 大 成 
功 。 例 如 ,IBM 的 360 系列 和 370 系列 计算 机 ,都 由 一 系列 的 性 能 不 同 、 价 格 不 同 . 具 体 组 
成 和 实现 也 不 同 的 机 型 组 成 ,但 它们 却 具 有 相同 的 指令 集 , 也 就 是 说 ,同一 个 机 器 语言 程序 
可 以 不 加 修改 地 在 这 些 不 同 机 型 的 机 器 中 运行 ,至 少 在 后 来 出 现 的 性 能 更 高 的 新 机 型 上 能 
运行 在 早期 机 型 中 使 用 的 已 有 程序 ( 反 过 来 则 未 必 行 得 通 ) ,这 被 称 为 系列 机 中 的 软件 兼容 
(Software Compatibility) .这 对 于 保护 计算 机 厂家 和 计算 机 用 户 的 软件 投资 都 是 十 分 重要 
的 。 另 外 还 出 现 了 硬件 .软件 的 “第 三 方 产品 ”, 一 些 规模 较 小 的 厂家 ,遵照 知名 厂家 的 计算 
机 体系 结构 ,或 者 软件 产品 功能 ,自己 重新 设计 并 实现 具有 更 高 性 能 价格 比 的 (用 户 更 欢迎 ) 
新 的 计算 机 组 成 ,或 者 更 廉价 的 软件 产品 .以 便 在 知名 大 公司 的 “夹缝 "中 找到 一 线 生 存 空 
间 , 这 也 是 推动 计算 机 技术 进步 的 一 种 额外 动力 。 还 是 再 次 回 到 计算 机 组 成 这 一 问题 本 身 
上 来 。 在 计算 机 组 成 的 领域 内 ,需要 重点 解决 的 问题 之 一 是 合理 的 性 能 价格 比 。 其 关键 的 
技术 措施 在 于 处 理 好 计算 机 内 部 的 数据 流 和 控制 流 , 合 理 地 匹配 各 功能 部 件 的 性 能 参数 ,也 
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就 是 尽力 避免 因 一 个 部 件 形成 的 “瓶颈 ?问题 而 影响 计算 机 的 整体 性 能 。 例 如 ,对 运算 器 部 
件 , 可 以 通过 实现 数据 运算 的 流水 线 处 理 和 设置 多 个 运算 功能 部 件 , 在 运算 器 内 安排 更 多 的 
寄存 器 等 措施 以 提高 其 处 理 数 据 的 能 力 ;对 控制 器 部 件 ,可 以 通过 指令 预 取 ,指令 流水 线 处 
理 , 多 指令 流水 线 .选用 RISC( Reduced Instruction Set Computer) 结 构 设 计 方 案 等 措施 以 
提高 执行 指令 的 速度 ;对 存储 器 部 件 ,使 用 由 高 速 缓冲 存储 器 \ 主 存储 器 、 虚 拟 存储 器 构成 的 
层次 结构 的 存储 系统 ,使 用 由 可 以 交替 运行 的 多 个 存储 器 构成 的 多 体 结构 ,使 用 性 能 更 高 的 
改进 型 的 存储 器 芯片 等 措施 ,以 提高 存储 器 系统 的 存储 容量 和 读 写 速度 。 对 输入 输出 设备 ， 
实现 通道 ,外围 处 理 机 等 方式 ,合理 地 设置 缓冲 器 和 排队 策略 ,配备 速度 更 快 的 设备 ,配备 更 
多 数量 的 设备 ,以 提高 单位 时 间 内 数据 输入 输出 的 流量 。 对 计算 机 系统 而 言 ,关键 是 尽 可 能 
地 使 计算 机 各 个 功能 部 件 都 以 自己 所 具有 的 高 速度 运行 ,避免 或 者 减少 不 同 功能 部 件 彼 此 
之 间 的 相互 制约 和 等 待 现象 。 例 如 ,通过 支持 多 线程 ,多 进程 .多 道 程序 .多 任务 等 措施 , 选 
用 最 合理 的 资源 调度 算法 和 分 配 策略 ,以 便 最 大 限度 地 提高 系统 的 资源 利用 率 。 

计算 机 实现 (Computer Implementation) 是 计算 机 组 成 的 物理 实现 。 其 包括 中 央 处 理 
机 、 主 存储 器 、 输 入 输出 接口 和 设备 的 物理 结构 ,所 选用 的 半导体 器 件 的 集成 度 和 速度 ,器 
件 . 模 块 .插件 、 底 板 的 划分 ,电源 、 冷 却 、 装 配 等 技术 ,生产 工艺 和 系统 调试 等 各 种 问题 。 可 
以 用 一 名 话 概括 ,就 是 把 完成 逻辑 设计 的 计算 机 组 成 方案 转换 为 真实 的 计算 机 设备 ,也 就 是 
把 满足 设计 和 和 运行、 价格 等 各 项 要 求 的 计算 机 系统 真正 地 制作 并 调试 出 来 。 

计算 机 体系 结构 .计算 机 组 成 和 计算 机 实现 是 3 个 不 同 的 概念 ,各 有 不 同 的 含义 ,但 是 
又 有 着 密切 的 联系 ,而 且 随 着 时 间 和 技术 的 进步 ,这 些 含意 也 会 有 所 改变 。 在 某 些 情况 下 ， 
有 时 也 无 须 特 意 地 去 区 分 计算 机 体系 结构 和 计算 机 组 成 的 不 同 含义 。 

若 对 上 述 3 项 内 容 的 讲解 止步 于 此 ,就 难以 给 学 生 留 下 明确 印象 ,我 们 还 是 结合 研制 开 
发 教学 计算 机 的 完整 过 程 ,看 一 下 有 哪些 问题 应 该 想到 并 需要 解决 ,这 部 分 内 容 仅 用 于 开阔 
同学 的 视野 ,不 属于 基本 教学 内 容 。 首 先 概述 教学 机 的 规划 目标 .关键 技术 .实施 措施 , 接 下 
来 从 教学 计算 机 的 系统 结构 .组 成 .实现 3 个 角度 列举 各 自 要 处 理 的 部 分 问题 。 

1. 规划 课题 目标 ,明确 产品 特点 

(1) 设计 实现 一 台 用 于 计算 机 硬件 课程 教学 的 计算 机 系统 ,要 求 硬件 组 成 简单 完整 , 体 
现 原理 清楚 ,配备 监控 程序 ,支持 汇编 编程 ,实验 功能 强大 ,方便 操作 运行 。 

(2) 能 实时 显示 整 机 系统 内 部 的 信息 存储 与 传送 的 时 间 一 空间 关系 ,是 对 教学 实验 设 
备 的 特殊 要 求 , 这 对 学 生 学 懂 计 算 机 组 成 原理 及 其 运行 机 制 .深入 理解 实验 内 容 至 关 重 要 。 

2. 选择 设计 技术 .确定 技术 方案 

(1) 控制 器 选用 现场 可 编程 的 isp MACH 器 件 实现 ,并 把 另外 一 些 功能 电路 也 纳入 到 
该 芯片 之 中 :运算 器 ,内存 和 串 行 接口 选用 中 小 规模 电路 实现 ,其 中 的 运算 器 使 用 4 片 4 位 
位 片 结构 的 运算 器 芯片 实现 ,内 存 选 用 静态 存储 器 芯片 并 使 用 字 位 扩展 技术 实现 ,与 CPU 
以 同步 方式 运行 。 

(2) 输入 输出 设备 选用 计算 机 仿真 终端 ,使 用 串 行 接口 把 仿真 终端 接 人 主机 系统 ,输入 
输出 采用 程序 直接 控制 方式 完成 ; 整 机 系统 采用 单 总 线 结 构 , 即 功能 部 件 之 间 都 通过 这 组 总 
线 传 送信 息 。 

(3) 选用 硬件 描述 语言 ABEL-HDL 的 逻辑 方程 方式 和 真 值 表 方 式 描述 MACH 芯片 
内 部 的 电路 结构 及 其 实现 的 功能 。 


计算 帮 系 统 碾 述 


(4) 选用 Altium Designer 软件 绘制 教学 机 系统 完整 的 原理 图 ,并 完成 印 制 电 路 板 上 的 
元 器 件 布局 和 布线 。 

3. 规划 工程 实现 ,确定 必要 措施 

(1) 采用 一 块 双 面 印 制 电路 板 布 放 全 部 元 器 件 , 控 制 器 中 的 IR 插 接 到 这 块 电路 板 上 ， 
其 他 3 个子 部 件 (PC、Timing、CU) 设 置 在 MACH 芯片 内 。 

(2) 全 部 的 半导体 器 件 都 通过 器 件 插座 插 接 在 电路 板 上 ,方便 系统 调试 与 维修 。 

(3) 实现 硬 布线 和 微 程序 两 种 控制 器 ,使 用 两 个 ABEL 程序 分 别 描述 其 电路 结构 和 
功能 。 

(4) 电路 板 上 设置 数量 足够 又 可 灵活 选用 的 拨 数 开关 和 指示 灯 , 并 为 数据 总 线 DB 地 
址 总 线 AB ,指令 寄存 器 IR .节拍 发 生 器 Timing 设置 专用 指示 灯 , 以 便 随 时 查看 计算 机 内 部 
的 数据 ,指令 .状态 信号 ,控制 信号 的 当前 值 ; 在 各 部 件 之 间 的 信息 传送 线 上 设置 用 于 接线 的 
插 针 , 既 可 以 连接 通用 的 拨 数 开关 ,也 可 以 连接 通用 的 指示 灯 。 

确定 指令 格式 、 功 能 和 指令 系统 属于 系统 结构 要 处 理 和 解决 的 问题 ,例如 : 

(1) 指令 字 长 16 位 ,操作 码 占 8 位 ,单字 指令 为 主 ,支持 最 常用 的 基本 寻 址 方式 。 

(2) 尽 可 能 小 的 指令 集 ,指令 数目 要 适当 地 少 。 

(3) 指令 系统 要 有 一 定 的 完备 程度 ,指令 格式 适当 规范 ,有 较 好 的 典型 性 ,指令 分 类 合 
理 ,适当 地 靠近 早期 计算 机 的 指令 系统 ,但 要 大 力 简化 。 

(4) 更 高 的 可 扩充 性 , 即 为 学 生 添加 各 种 新 的 指令 留 足 余地 ,把 指令 划分 为 基本 指令 组 
(设计 监控 程序 必用 ) 和 扩展 指令 组 (由 学 生 扩 展 ,设计 BASIC 解释 程序 要 用 到 ) 两 类 。 

(5) 满足 教学 计算 机 特定 的 实验 要 求 , 易 于 硬件 实现 ,方便 设计 汇编 和 反 汇编 程序 。 

设计 计算 机 的 硬件 系统 组 成 属于 计算 机 组 成 的 内 容 , 围 绕 如 何 实现 每 条 指令 的 具体 功 
能 开展 工作 ,需要 处 理 好 如 下 一 些 问 题 。 

(1) 硬件 部 件 完 整 ,包含 计算 机 传统 的 5 个 功能 部 件 ,其 中 主 存储 器 选用 静态 存储 器 芯 
片 实现 ,要 用 到 字 位 扩展 技术 ,输入 设备 (键盘 ) 和 输出 设备 (显示 器 ) 可 选用 计算 机 仿真 终端 
实现 ,要 求 使 用 串 行 接口 芯片 将 其 接 和 人 主机 系统 。 

(2) 配备 小 巧 的 软件 系统 ,使 用 已 有 的 基本 指令 设计 监控 程序 ,以 类 似 计算 机 Debug 程 
序 的 方式 运行 ,支持 汇编 语言 编程 。 

(3) 监控 程序 以 等 待 输入 监控 命令 .分 析 命令 .执行 命令 这 3 个 步骤 的 循环 方式 运行 ， 
支持 使 用 G 和 T 命令 调用 用 户 程 序 , 要 正确 处 理 监控 程序 和 用 户 程序 的 现场 切换 ,允许 在 
用 户 程序 中 调用 监控 程序 中 的 子 程序 。 

把 计算 机 系统 制作 出 来 并 完成 调试 属于 计算 机 实现 的 内 容 , 要 解决 好 如 下 一 些 问题 。 

(1) 使 用 尽 可 能 少 的 电路 芯片 构成 运算 器 和 存储 器 , 整 机 系统 制作 在 一 块 电路 板 上 并 
合理 布局 ,使 部 件 划分 和 连接 关系 尽 可 能 地 简单 清晰 ,这 有 利于 突出 计算 机 组 成 的 原理 知 
识 , 避 免 被 过 多 的 线路 模糊 了 视线 。 

(2) 选用 较 高 集成 度 的 一 片 可 现场 编程 的 器 件 实现 控制 器 ,把 尽 可 能 多 的 功能 电路 纳 
人 到 这 个 芯片 中 实现 ,提供 先进 的 计算 机 设计 技术 ,选用 ABEL 语言 描述 控制 器 的 组 成 结 
构 与 功能 实现 ,更 有 利于 学 生 深 入 理解 原理 知识 和 简化 实验 操作 。 

(3) 在 设备 的 主板 上 ,应 以 醒目 方式 区 分 计算 机 关键 部 件 和 实验 辅助 电路 两 个 部 分 ,后 
者 是 为 支持 各 项 教学 实验 而 设置 的 .包括 向 系统 内 拨 和 调试 信息 用 到 的 多 组 开关 的 元 器 件 、 
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显示 计算 机 内 部 信息 状态 用 到 的 指示 灯 的 元 器 件 , 以 及 时 钟 产生 与 启 停 控 制 电路 等 ,这 些 不 
属于 计算 机 组 成 的 基本 教学 内 容 , 会 用 即 可 ;选用 6 组 的 8 位 开关 向 系统 中 的 部 件 (芯片 ) 提 
供 输入 信息 ,或 选用 4 组 的 8 位 指示 灯 显示 系统 内 部 的 有 关 信 息 都 要 通过 接线 操作 实现 ; 另 
外 有 3 组 16 位 的 指示 灯 属 于 专用 ,分 别 接 在 数据 总 线 DB、 地 址 总 线 AB、 指 令 寄 存 器 IR 的 
输出 管 脚 ,充分 用 好 这 3 组 指示 灯 对 教学 实验 大 有 神 益 。 

(4) 为 了 支持 使 用 6 组 拨 数 开关 向 某 个 部 件 或 系统 拨 和 信息 ,或 者 使 用 4 组 通用 指示 
灯 显 示 某 些 信息 ,需要 在 教学 机 的 主要 数据 或 信号 的 传送 线 上 设置 接线 用 的 插 针 、 插 孔 ,这 
极 大 地 提高 了 这 些 辅助 电路 的 使 用 效率 ,也 为 不 同 层次 的 教学 实验 提供 了 更 大 的 灵活 性 和 
选择 空间 ,确保 计算 机 内 部 信息 的 时 间 一 空间 关系 都 可 以 看 到 ,可 以 有 效 提高 教学 实验 的 
质量 。 

(5) 为 了 更 简便 地 支持 不 同 层次 (芯片 级 部件 级 、 整 机 系统 级 ) 的 教学 实验 ,简化 整 机 
系统 构建 和 部 件 拆 分 ,在 教学 机 主板 上 设置 有 4 个 小 开关 ,分 别 用 于 接 通 Am2901 芯片 ( 运 
算 器 )、MACH 芯片 (控制 器 )、Am2910 芯片 ( 微 程序 定 序 芯 片 )、.FPGA 芯片 (另外 一 个 
CPU) 的 电源 ,只 向 用 到 的 芯片 供电 , 关 掉 暂 不 用 芯片 的 电源 , 则 它 就 不 再 影响 与 它 有 连接 
关系 的 电路 的 运行 状态 ,确保 可 以 孤立 出 某 个 ( 些 ) 芯 片 、 某 个 ( 些 ) 部 件 ,可 依据 实验 需求 灵 
活 安 排 。 

在 本 教材 中 ,我 们 把 更 多 的 注意 力 放 到 了 计算 机 组 成 方面 ,例如 第 4 章 的 运算 器 ,第 6 
到 第 11 章 的 控制 器 、 主 存储 器 、 高 速 缓存 .虚拟 存储 器 、 输 入 输出 系统 ,输入 输出 设备 等 是 更 
多 地 围绕 计算 机 组 成 原理 的 教学 要 求 来 编写 的 ,突出 知识 的 基础 性 和 实用 性 。 这 部 分 知识 
和 相关 技术 是 计算 机 硬件 的 基础 内 容 . 也 是 学 习 和 理解 计算 机 体系 结构 的 必要 准备 。 把 计 
算 机 体系 结构 的 主要 内 容 集中 安排 到 第 12 章 ( 指 令 流水 线 技术 ) 和 第 13 章 ( 并 行 计算 机 体 
系 结构 ), 重 点 放 到 提高 计算 机 性 能 的 可 行 途径 和 有 关 技 术 。 就 计算 机 实现 方面 .我们 强调 
可 以 使 用 计算 机 组 成 的 基础 知识 及 其 部 件 实例 构造 出 一 台 能 正常 运行 的 计算 机 系统 ,会 六 
及 某 些 具体 的 工程 与 技术 问题 ,将 在 配套 的 实验 指教 材 中 进行 说 明 。 


1.5 计算 机 发 展 进步 .分 类 和 拓展 应 用 的 进程 


计算 机 原本 的 含义 ,简单 地 从 字面 上 讲 , 指 的 是 能 够 完成 数值 计算 功能 的 工具 。 例 如 ， 
在 我 国 已 经 使 用 了 2500 多 年 、 现 在 仍 被 使 用 的 算盘 就 属于 这 一 范围 。 它 采用 一 竖 列 中 的 多 
个 算盘 珠子 表示 十 进 制 数 一 位 上 的 数值 ,为 0 一 9 ,连续 的 几 列 表示 十 进 制 数 不 同 的 数位 ,位 
之 间 采 用 十 进 制 规则 ,人 们 通过 拨 动 算盘 珠子 .就 能 方便 快速 地 完成 加 、 减 .乘除 等 数值 计 
算 过 程 。 在 电子 计算 器 或 者 电子 计算 机 普及 之 前 ,计算 尺 也 是 工程 界 广泛 使 用 的 计算 工具 
之 一 。 计 算 尺 是 在 木 制 的 尺子 形状 的 材料 上 , 印 上 各 种 刻度 和 数字 标记 ,通过 拉动 中 间 可 移 
动 的 部 分 , 找 出 不 同位 置 上 刻度 (数字 标记 ) 的 对 应 关系 ,来 完成 一 次 计算 过 程 ,在 科学 研究 、 
工程 设计 等 数值 计算 的 领域 曾 被 广泛 应 用 ,计算 功能 的 专用 性 和 较 大 的 误差 限制 了 它 的 应 
用 范围 。 与 此 相 呼应 的 ,还 有 通过 齿轮 和 拉动 杆 等 做 成 的 机 械 式 计算 机 ,包括 手 摇 的 或 者 电 
动 的 ,也 曾 被 广泛 地 用 于 完成 加 、 减 .乘除 等 算术 运算 ,通用 性 较 好 ,但 运算 效率 仍然 比 
较 低 。 

现在 谈论 的 计算 机 ,通常 指 的 都 是 电子 数字 计算 机 系统 。 与 前 面 刚 提 到 的 几 种 计算 工 
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具 相 比 ,无 论 从 它 的 通用 性 .计算 速度 .处 理 数 据 的 能 力 、 实 现 计 算 自 动 化 的 程度 等 任何 一 个 
方面 去 看 ,都 有 了 本 质 性 的 变化 。 电 子 数字 计算 机 诞生 半 个 多 世纪 以 来 ,其 性 能 提高 之 快 ， 
应 用 领域 拓展 之 宽 , 对 社会 发 展 以 及 人 们 的 生活 方式 的 影响 之 深远 , 令 人 震撼 。 

计算 机 系统 的 性 能 ,主要 指 的 是 它 的 运行 速度 和 处 理 数 据 的 能 力 。 不 妨 先 简单 地 回顾 
一 下 计算 机 性 能 增长 的 历程 。 

(1) 20 世纪 70 年 代 之 前 ,计算 机 性 能 增长 速度 缓慢 ,但 形成 了 至 今 仍 被 广泛 采用 的 
冯 “， 诺 依 曼 先生 提出 的 存储 程序 计算 机 的 完整 概念 。 

(2) 到 了 20 世纪 70 年 代 , 由 于 集成 电路 的 出 现 和 迅速 发 展 ,推动 计算 机 的 性 能 以 每 年 
25%~30% 的 速度 增长 。 

(3) 20 世纪 80 年 代 之 后 ,集成 电路 技术 的 进步 并 结合 计算 机 体系 结构 的 变革 ,计算 机 
的 性 能 更 达到 了 每 年 50% 的 增长 速度 。 

(4) 到 了 20 世纪 90 年 代 中 期 之 后 ,主要 依靠 计算 机 体系 结构 的 发 展 ,计算 机 的 性 能 仍 
保持 了 每 年 50% 的 增长 速度 。 可 以 看 到 ,计算 机 性 能 的 提高 ,在 物质 的 层面 上 ,依靠 的 是 集 
成 电路 生产 工艺 改进 所 带 来 的 半导体 器 件 性 能 的 提高 ,在 技术 的 层面 上 ,依靠 的 是 计算 机 体 
系 结构 和 组 成 方面 的 创新 与 进步 。 

从 制作 计算 机 使 用 的 元 器 件 的 不 同 来 看 ,计算 机 的 发 展 依次 经 历 了 电子 管 时 代 , 晶 体 管 
时 代 , 中 小 规模 集成 电路 时 代 , 大 规模 .超大 规模 集成 电路 时 代 4 个 不 同 的 发 展 阶段 。 

(1) 电子 管 计算 机 时 代 。 电 子 管 是 封装 在 玻璃 外 壳 内 的 一 种 电 真空 器 件 , 用 它 可 以 设 
计 出 实现 反 相 功能 的 反 相 器 线路 ,在 此 基础 上 ,再 设计 出 计算 机 所 使 用 的 全 部 组 合 罗 辑 线 
路 ,诸如 加 法 器 . 译 码 器 等 线路 ,以 及 和 触发 器 .寄存 器 .计数 器 等 各 种 时 序 逻 辑 线 路 。 这 时 的 
计算 机 是 用 分 立 的 元 件 .器 件 实现 出 来 的 。 最 早 的 一 台电 子 管 计算 机 包括 18000 多 个 电子 
管 ,1500 多 个 继电器 ,体积 庞大 , 耗 电 和 发 热量 也 很 大 ,价格 极 高 ,但 实现 的 处 理 功能 相对 较 
低 ,每 秒 可 以 完成 5000 次 的 十 进 制 加 法 运算 , 连 存储 器 部 件 都 没有 , 它 的 程序 是 通过 插 线 和 
开关 实现 的 。 计 算 机 可 靠 性 也 差 , 应 用 范围 很 窄 。 到 后 来 ,形成 了 存储 程序 计算 机 的 概念 ， 
并 用 磁 芯 构建 了 计算 机 的 存储 器 部 件 , 程 序数 据 的 输入 和 输出 也 可 以 通过 纸 带 穿孔 机 设 
备 .卡片 机 设备 等 完成 。 还 制作 出 用 于 保存 数据 的 磁带 、 磁 鼓 等 外 存储 器 设备 ,计算 机 开始 
进入 了 商业 性 应 用 阶段 。 

(2) 晶体 管 计 算 机 时 代 。 晶 体 管 通常 指 的 是 晶体 三 极 管 . 是 用 半导体 材料 制作 出 来 、 封 
装 在 一 个 金属 壳 内 的 带 有 3 个 管 脚 的 小 器 件 ,1958 年 进入 批量 生产 阶段 。 用 它 可 以 设计 出 
实现 反 相 功能 的 反 相 器 线路 ,在 此 基础 上 ,再 设计 出 计算 机 所 使 用 的 全 部 组 合 逻 辑 线路 ,以 
及 触发 器 .寄存 器 .计数 器 等 各 种 时 序 逻 辑 线路 。 这 时 的 计算 机 仍然 是 用 分 立 的 元 件 、. 器 件 
实现 出 来 的 ,但 与 电子 管 的 计算 机 相 比 ,晶体 管 的 体积 更 小 , 耗 电 和 发 热量 更 低 , 工 作 可 靠 性 
更 高 。 因 此 ,晶体管 计算 机 体积 要 小 得 多 .有 条 件 实 现 更 复杂 和 更 强 的 处 理 功能 ,运行 速度 
更 快 ,价格 上 也 有 所 下 降 , 系 统 运行 的 可 靠 性 得 到 明显 提高 ,应 用 范围 有 了 很 大 的 拓展 ,计算 
机 真正 进入 了 广泛 应 用 的 阶段 。IBM 公司 经 历 了 艰苦 的 创业 过 程 ,并 初步 登 上 了 这 一 领域 
的 霸主 地 位 。 

(3) 中 小 规模 集成 电路 时 代 。 随 着 半导体 器 件 生产 工艺 与 技术 上 的 进步 ,在 一 片 半 导 
体 基 片 上 ,可 以 生产 出 多 个 晶体 管 , 并 用 它们 形成 具有 一 定 处 理 功能 的 逻辑 器 件 ,这 就 是 集 
成 电路 (Integrated Circuit) 。 此 时 集成 到 一 个 芯片 内 的 晶体 管 数量 还 相当 有 限 , 实 现 的 还 
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只 限于 简单 的 、 完 成 基本 处 理 功 能 的 组 合 逻辑 门 一 级 的 电路 和 简单 的 触发 器 .寄存 器 之 类 的 
电路 , 故 被 称 为 中 小 规模 集成 电路 。 使 用 这 种 器 件 设计 与 实现 出 来 的 计算 机 属于 中 小 规模 
集成 电路 的 计算 机 , 它 更 精 小 和 廉价 ,计算 能 力 和 可 靠 性 也 更 高 ,为 计算 机 的 普及 应 用 葛 定 
了 坚实 的 基础 。 在 此 期 间 ,IBM 在 其 System/360 大 型 计算 机 产品 中 ,形成 了 计算 机 体系 结 
构 的 基本 概念 ,制作 出 有 着 相同 体系 结构 却 有 着 不 同 组 成 和 不 同性 能 的 系列 计算 机 ,进一步 
捍卫 了 自己 在 计算 机 领域 的 世界 霸主 地 位 。 

(4) 大 规模 和 超大 规模 集成 电路 时 代 。 半 导体 器 件 生产 工艺 的 改进 ,使 得 在 一 片 半 导 
体 基 片上 ,可 以 生产 出 数量 更 多 的 晶体 管 , 就 形成 了 大 规模 集成 (Large Scale Integration) 电 
路 ; 若 在 一 个 芯片 上 的 晶体 管 数量 达到 更 多 ,就 被 叫 作 超大 规模 集成 (Super Large Scale 
Integration) 电 路 ;单个 芯片 内 的 晶体 管 数量 达到 百 万 个 时 被 叫 作 甚大 规模 集成 (Ultra 
Large Scale Integration) 电路; 达到 一 亿 个 时 被 叫 作 极 大 规模 集成 (Extremely Large Scale 
Integration) 电 路 。 用 大 规模 和 超大 规模 集成 电路 制作 出 来 的 计算 机 属于 大 规模 、 超 大 规模 
集成 电路 的 计算 机 。 其 代表 产品 就 是 通过 单 片 IC 制作 出 计算 机 的 CPU, 或 者 微 处 理 机 
(Microprocessor)。 个 人 计算 机 的 出 现 和 普遍 应 用 是 这 一 期 间 的 重要 成 就 。 集 成 在 一 个 芯 
片 中 的 电路 数量 越 多 ,就 越 能 够 提供 出 更 强 处 理 能 力 的 计算 机 部 件 ,其 至 一 个 高 性 能 的 计算 
机 处 理 器 。 更 强 处 理 能 力 和 处 理 速度 的 工作 站 (Workstation) 和 精简 指令 系统 的 计算 机 
(Reduced Instruction Set Computer,RISC) 的 出 现 , 进 一 步 推动 了 计算 机 体系 结构 和 实现 技 
术 的 发 展 。 超 标量 技术 (多 发 射 指令 技术 ) 和 乱 序 执行 (Out-of-order Execution) 的 使 用 都 是 
本 时 期 的 重要 技术 成 果 。 

上 面 是 根据 实现 计算 机 所 选用 电路 的 器 件 种 类 来 划分 计算 机 的 发 展 进程 的 ,依据 这 些 
器 件 出 现 的 先后 顺序 又 表现 为 电子 管 时 代 , 晶 体 管 时 代 , 中 小 规模 集成 电路 时 代 , 大 规模 和 
超大 规模 集成 电路 时 代 。 如 果 依 据 计 算 机 所 提供 的 功能 和 运行 性 能 来 划分 ,又 可 以 把 计算 
机 划分 为 巨型 计算 机 、 大 型 计算 机 、 中 小 型 计算 机 和 微型 计算 机 ,这 种 划分 标准 并 不 是 绝对 
的 ,把 一 台 计算 机 划分 在 哪 一 类 中 ,和 计算 机 发 展 的 进程 密切 相关 。 例 如 ,现在 的 一 台 微 型 
计算 机 的 功能 和 性 能 ,可 能 比 40 年 前 的 大 型 计算 机 的 功能 还 要 强大 。 这 是 计算 机 发 展 进步 
的 重要 成 果 和 具体 表现 。 

计算 机 另外 一 种 分 类 办 法 是 Flynn 分 类 法 。 在 1966 年 ,M. J. Flynn 提出 如 下 定义 : 

Oa 指令 流 (Instruction Stream) 一 一 机 器 执行 的 指令 序列 ; 

@ 数据 流 (Data Stream) 一 一 由 指令 流 调用 的 数据 序列 ,包括 输入 数据 和 中 间 数 据 ; 

@ 多 倍 性 (Multiplicity) 一 一 在 系统 中 最 受 限 制 的 元 件 上 同时 处 于 同一 执行 阶段 的 指 
令 或 数据 的 最 大 可 能 个 数 。 

其 按照 指令 流 和 数据 流 的 不 同 的 组 织 方式 ,把 计算 机 系统 的 结构 分 为 以 下 4 类 : 

@ 单 指令 流 单 数据 流 (Single Instruction stream Single Data stream,SISD); 

@ 单 指令 流 多 数据 流 (Single Instruction stream Multiple Data stream,SIMD) ; 

@ 多 指令 流 单 数据 流 (Multiple Instruction stream Single Data stream,MISD) ; 

@ 多 指令 流 多 数据 流 (Multiple Instruction stream Multiple Data stream,.MIMD) 。 

上 面 的 第 1 种 是 传统 的 指令 顺序 执行 的 处 理 机 系统 ;第 2 种 以 阵列 处 理 机 或 并 行 处 理 
机 为 代表 ;第 4 种 属于 多 处 理 机 系统 。 多 数 人 对 第 3 种 有 不 同 的 看 法 ,认为 这 是 一 种 难以 实 
用 的 方案 ,在 有 的 文献 中 把 流水 线 结构 的 计算 机 看 作为 MISD 结构 。 
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计算 机 的 发 展 ,进步 的 另 一 个 方面 ,表现 在 其 应 用 领域 的 扩展 和 对 社会 变革 进步 带 来 
的 深刻 影响 。 简 单列 举 (并 非 完整 全面) 如 下 。 

(1) 计算 机 作为 计算 工具 ,完成 各 种 复杂 的 科学 计算 是 它 的 一 个 重要 应 用 方面 。 其 在 
科学 研究 工程 设计 、 天 气 预报 ,地质 与 石油 勘探 等 各 个 领域 发 挥 着 重要 的 作用 。 

(2) 计算 机 作为 数据 处 理工 具 , 在 政府 办 公 , 企 ,事业 单位 的 管理 等 领域 也 发 挥 着 重要 
的 作用 。 对 政府 大 量 的 档案 和 公文 收发 .保存 和 检索 ,业务 信息 的 处 理 与 办 公 流 程 自 动 化 管 
理 , 信 息 分 析 与 科学 决策 等 方面 提供 支持 。 对 企业 单位 的 人 、 财 . 物 、 购 、 销 、 存 等 信息 的 保存 
与 管理 ,市 场 预 测 和 经 营 决策 等 方面 提供 支持 。 

(3) 计算 机 作为 具有 高 速 和 灵活 的 逻辑 处 理 能 力 的 工具 ,被 广泛 地 应 用 于 工业 生产 、 航 
天 发 射 等 过 程 的 实时 控制 。 其 包括 用 于 产品 的 辅助 设计 (CAD) 和 辅助 制造 (CAM)。 

(4) 计算 机 作为 具有 高 速 和 灵活 的 逻辑 处 理 和 推理 能 力 的 工具 ,在 人 工 智能 领域 ,完成 
诸如 数学 定理 证 明 , 自 然 语言 理解 ,知识 表示 和 挖掘 ,密码 处 理 和 破译 ,智能 机 器 人 研制 和 应 
用 ,计算 机 翻译 等 需要 有 一 定 轨 辑 推理 的 领域 发 挥 着 重要 的 作用 。 

(5) 随 着 计算 机 网 络 的 出 现 和 发 展 ,计算 机 已 经 成 为 在 大 范围 内 传播 信息 和 实现 人 员 
沟通 的 重要 工具 。 之 后 相继 出 现 了 电子 政府 .电子 商务 ,网络 教育 .远程 诊断 ,网 上 信息 检索 
等 多 种 应 用 , 极 大 地 改变 了 人 类 的 生活 环境 和 交流 方式 。 


本 章 内 容 小 结 和 学 习 方 法 建议 


本 章 是 作为 学 习 计算 机 组 成 原理 和 体系 结构 课程 的 引导 性 提纲 来 编写 的 。 其 主要 目标 
不 是 让 读者 掌握 计算 机 组 成 与 体系 结构 具体 深入 的 知识 ,而 是 希望 读者 能 初步 理解 计算 机 
系统 的 总 体 构成 及 其 关键 术语 ,初步 了 解 计 算 机 系统 中 的 主要 技术 与 性 能 指标 ;理解 计算 机 
硬件 的 5 个 功能 及 其 各 自分 担 的 功能 ,了 解 计算 机 系统 结构 和 计算 机 组 成 各 自 要 解决 的 主 
要 问题 。 本 章 的 要 求 是 了 解 计 算 机 系统 中 的 硬件 和 软件 组 成 及 其 层次 关系 ,3 个 级 别 的 计 
算 机 语言 ;了 解 计 算 机 的 发 展 过程 及 其 各 个 阶段 的 重要 进展 ,计算 机 分 类 方法 ,计算 机 的 应 
用 领域 及 其 对 社会 发 展 和 人 类 生活 的 重大 影响 。 这 些 内 容 虽然 浅显 ,但 对 把 握 本 课程 教学 
的 主 脉 络 是 有 益 的 。 在 后 续 的 学 习 过 程 中 ,不 妨 随 时 回 过 头 来 与 这 里 的 内 容 对 照 一 下 。 

可 以 通过 1 ~ 6 这 几 个 数字 来 概括 本 章 的 基本 内 容 。 

一 个 完整 的 计算 机 系统 由 硬件 和 软件 2 个 子 系统 组 成 ,它们 被 划分 在 6 个 不 同 的 层次 ; 
硬件 子 系统 由 5 个 功能 部 件 组 成 ,要 通过 3 种 类 型 的 总 线 连接 在 一 起 ,涉及 5 项 性 能 指标 ; 
软件 子 系统 有 3 个 级 别 的 语言 ;可 按照 Flynn 分 类 标准 划分 计算 机 为 4 种 不 同 的 结构 。 








习题 与 思考 题 
1. 什么 是 计算 机 系统 ? 哪些 部 分 属于 硬件 系统 ,哪些 部 分 属于 软件 系统 ? 应 如 何 看 竺 


二 者 之 间 的 关系 ? 

2. 人 们 通常 说 的 汉 “。 诺 依 曼 结构 的 计算 机 有 哪些 特点 ? 

3. 从 传统 的 观点 来 看 ,基本 计算 机 硬件 系统 由 哪 几 个 功能 部 件 组 成 ?每 个 部 件 完 成 的 
主要 功能 是 什么 ? 它们 之 间 是 如 何 连 接 在 一 起 的 ? 
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4. 什么 是 计算 机 系统 的 层次 结构 ? 一 般 可 以 划分 为 哪 几 个 层次 ? 层次 之 间 的 关系 体 
现在 哪些 方面 ? 采用 层次 结构 的 观点 来 看 待 、 分 析 计 算 机 系统 的 功能 和 组 成 有 什么 好 处 ? 

5. 指令 系统 对 计算 机 硬件 和 软件 的 影响 表现 在 哪些 方面 ? 

6. 通常 可 以 把 程序 设计 语言 划分 为 哪 几 个 层次 ? 各 自 的 优 、 缺 点 表现 在 哪些 方面 ? 

7. 在 比较 不 同 计算 系统 的 性 能 时 ,通常 可 以 从 哪 几 个 基本 的 技术 与 性 能 指标 入 手 ? 

8. 计算 机 体系 结构 .计算 机 组 成 和 计算 机 实现 各 自主 要 处 理 哪些 方面 的 问题 ? 你 是 怎 
样 看 待 三 者 之 间 的 关系 的 ? 

9. 计算 机 发 展 经 历 了 哪 几 个 时 代 ? 每 个 发 展 时 代 的 计算 机 的 主要 特点 表现 在 哪些 
方面 ? 

10. 有 哪 几 种 对 计算 机 系统 进行 分 类 的 方法 ? 各 自 反映 的 是 计算 机 系统 哪 一 个 方面 的 
特性 ? 

11. 计算 机 可 以 应 用 在 哪些 领域 ? 它 对 今天 的 社会 发 展 和 人 们 的 生活 方式 有 什么 
影响 ? 

12. 下 列 选项 中 ,描述 浮 点 数 操作 速度 指标 的 是 

A. MIPS B. CPI GC, IPC D. MFLOPS 

13. 要 学 好 本 课程 ,应 选择 什么 样 的 学 习 态 度 ? 需要 注意 哪些 方面 的 问题 ? 








数字 电路 基础 和 常用 器 件 


本 章 首先 介绍 数字 电路 的 基本 元 件 ,还 给 出 了 几 个 应 用 案例 ;包括 数字 电路 基础 及 其 处 
理 方法 ;介绍 基本 人 逻辑 关系 、 逻 辑 函 数 及 其 描述 方法 ;在 常用 公式 和 基本 规则 的 基础 上 ,简要 
地 介绍 逻辑 设计 、 人 逻辑 函数 化 简 。 

其 次 介绍 在 计算 机 的 逻辑 部 件 中 常用 到 的 中 小 规模 电路 器 件 ,包括 组 合 逻 辑 电 路 和 时 
序 馆 辑 电路 ,这 些 是 学 习 \ 设 计 、 实 现 计算 机 硬件 系统 的 必 备 知识 。 

最 后 介绍 CPLD 和 FPGA 等 现场 可 编程 逻辑 器 件 .包括 它们 的 内 部 组 成 和 使 用 特性 。 

本 章 内 容 属 于 计算 机 组 成 原理 课程 的 先 修 知 识 , 读 者 可 以 根据 自己 的 已 有 基础 ,采用 浏 
览 或 者 选 学 其 中 某 些 音节 的 办 法 来 处 理 。 


2.1 数字 电路 的 基本 元 件 


2.1.1 晶体 二 极 管 与 三 极 管 


1. 二 极 管 
自然 界 中 的 物质 根据 其 导电 特性 可 以 分 为 导体 .绝缘 体 和 半导体 。 钳 、 硅 、 砷 化 匀 等 由 
P pn 于 它们 的 导电 特性 处 于 导体 和 绝缘 体 之 间 而 被 称 为 半导体 。 


在 同一 半导体 基 片 上 ,分 别 制造 P 型 半导体 和 NN 型 半导体 ,经 
过 载 流 子 的 扩散 ,在 它们 的 交界 面 处 就 形成 了 PN 结 ,PN 结 加 上 管 

壳 和 引线 ,就 成 为 半导体 二 极 管 (Diode)。 二 极 管 及 其 符号 如 图 2. 1 所 示 。 
当 在 PN 结 的 某 一 个 方向 上 加 一 个 适当 的 电压 后 ,这 种 器 件 可 以 导电 ,表现 出 一 个 导体 
的 特性 ;而 在 相反 的 方向 上 加 一 个 电压 后 .这 种 器 件 就 几乎 不 导电 ,表现 出 一 个 绝缘 体 的 特 
性 ,这 就 是 二 极 管 的 单 向 导电 特性 。 + 


图 2.1 二 极 管 的 符号 








为 讨论 问题 方便 ,常常 将 晶体 二 极 管 看 成 一 个 理想 的 凡 凡 
二 极 管 ,在 数字 电路 中 ,理想 二 极 管 等 效 于 一 个 开关 ,如 a 
图 2.2 所 示 。 在 加 正 向 电压 时 ,这 个 电子 开关 处 于 闭合 状 K K 
态 , 在 加 反 向 电压 时 ,处 于 打开 状态 。 图 2.2 ”理想 二 极 管 等 效 于 开关 


2. 双 极 型 三 极 管 
双 极 型 三 极 管 也 常 称 为 晶体 管 (Transistor), 它 可 以 通过 控制 基 极 电流 来 控制 输出 电 
流 , 其 在 数字 电路 中 应 用 十 分 广泛 。 
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它 的 结构 由 两 个 PN 结 ( 发 射 结 、 集 电 结 ) 组 成 ,包括 NPN 型 和 PNP 型 两 种 ,3 个 引出 
电极 是 发 射 极 e、 基 极 b 和 集 电极 c, 如 图 2. 3 所 示 。 

双 极 型 三 极 管 的 工作 状态 有 饱和 、 截 止 和 放大 3 种 。 数 字 电 路 中 经 常用 前 两 种 , 即 工作 
在 开关 状态 ,如 图 2.4(a) 所 示 。 理 想 的 三 极 管 也 可 以 看 成 一 个 在 基 极 b 控制 下 的 开关 , 即 
它 在 截止 时 打开 ,饱和 时 闭合 。 
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(a) NPN 型 (b) PNP 型 (a) 

图 2.3 双 极 型 三 极 管 图 2.4 反 相 器 .可 控 开 关 


3. MOS 管 

金属 -氧化 物 - 半 导体 场 效 应 三 极 管 (Metal Oxide Semiconductor Field Effect 
Transistor,MOS 管 ) ,是 用 电场 控制 输出 电流 的 场 效应 半导体 器 件 。 其 中 增强 型 MOS 管 
的 结构 与 符号 如 图 2. 5 所 示 。MOS 管 可 分 为 N 沟 道 (NMOS) 和 了 沟 道 (PMOS) 两 种 类 型 ， 
任何 一 种 都 有 3 个 与 外 部 连接 的 电极 ,分 别 为 源 极 (Source) 、 栅 极 (Gate) 、 漏 极 (Drain) 。 它 
的 衬 底 一 般 与 源 极 相连 , 衬 底 与 栅 极 由 绝缘 层 二 氧化 硅 (SiO:) 隔 开 , 大 多 数 情况 下 , 源 极 和 
漏 极 是 可 以 互 换 的 。 
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(a) NMOS 的 结构 (b) NMOS (c) PMOS 
图 2.5 增强 型 MOS 管 的 结构 及 其 符号 

















截止 和 深度 饱和 两 种 状态 常常 是 MOS 数字 电路 工作 时 所 处 的 状态 ,图 2. 6(a) 是 一 个 
NMOS 反 相 器 ,理想 的 MOS 管 也 是 一 个 如 图 2. 6(b) 所 示 的 可 控 开 关 。 
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(a) (b) 
图 2.6 NMOS 反 相 器 ,理想 MOS 管 
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2.1.2 应 用 案例 


1. 二 极 管 应 用 案例 

1) 二 极 管 门 电路 

二 极 管 可 以 用 作 开 关 , 构 成 各 种 门 电路 。 图 2. 7 是 用 二 极 管 构成 的 一 个 与 门 电路 。 按 
理想 二 极 管 分 析 ,Di 管 在 正 向 电压 的 作用 下 ,优先 导 通 ,相当 于 开关 Ki 合 上 ,将 U。 电位 钳 
制 在 0V,D: 管 则 反 偏 截止 ,相当 于 开关 打开 , 仅 起 隔离 作用 。 

2) 只 读 存 储 器 

利用 二 极 管 的 单 向 导电 性 ,还 可 以 构成 只 读 存 储 器 ,如 图 2. 8 所 示 ,输入 的 字 线 X 和 
输出 的 位 线 O 之 间接 一 个 二 极 管 的 位 相当 于 存 和 人 1 信号 ,无 二 极 管 的 位 相当 于 存 人 0 
信号 。 

2. 双 极 型 三 极 管 应 用 案例 

利用 三 极 管 的 开关 特性 ,可 以 构成 反 相 器 、 双 稳 态 触发 器 电路 和 存储 单元 电路 等 。 

三 极 管 反 相 器 如 图 2.6 所 示 。 

双 极 型 三 极 管 存储 阵列 元 如 图 2. 9 所 示 , 很 容易 用 理想 三 极 管 的 导 通 和 截止 特性 来 分 
析 它 的 原理 。 
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图 2.7 二 极 管 门 电路 图 2.8 二 极 管 只 读 存储 器 图 2.9 三 极 管 只 读 存 储 器 


3. MOS 管 应 用 案例 

利用 MOS 管 的 开关 特性 也 可 以 构成 许多 基本 的 数字 逻辑 部 件 。 

1) CMOS 反 相 器 

CMOS 工艺 是 在 电路 中 同时 使 用 NMOS 和 PMOS 管 .图 2. 10 是 一 个 功 耗 极 小 的 
CMOS 反 相 器 。 由 理想 MOS 管 可 以 容易 地 得 出 , 当 输入 端 为 高 电 平 ( 例 如 十 5V),NMOS 
管 导 通 ,PMOS 管 截止 ,输出 为 低 电 平 ( 例 如 0V); 反 之 输出 为 高 电 平 ( 十 5V) 。 

2) 单 管 动态 存储 器 

图 2. 11 是 一 个 一 位 单 管 动态 存储 器 基本 电路 。C 为 存储 1 位 信息 的 元 件 ; 工 为 NMOS 
管 ;在 字 线 为 高 电 平 时 工 导 通 (注意 : 大 多 数 情况 下 , 源 极 和 漏 极 是 可 以 互 换 的 ) ,这样 才 能 
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对 该 位 存储 器 通过 位 线 对 它 进行 读 写 操作 。 
EPROM EEPROM 和 闪存 (Flash Memory) 都 是 基于 MOS 管 的 工作 原理 。 























NMOS 











图 2.10 CMOS 反 相 器 图 2.11 一 位 单 管 动态 存储 器 


2.2 数字 电路 基础 及 其 相关 处 理 方法 


2.2.1 3 种 基本 逻辑 关系 


数字 电路 通常 由 组 合 逻辑 电路 和 时 序 电 路 组 成 。 计 算 机 硬件 电路 中 的 存储 器 ,控制 器 、 
寄存 器 . 译 码 器 (地 址 .指令 等 ) .加 法 器 等 ,都 是 数字 电路 的 具体 应 用 ,与 .或 和 非 门 是 构成 这 
些 部 件 最 简单 也 是 最 基本 的 逻辑 电路 。 

1. 与 .或 、 非 门 

1) 与 门 

数字 电路 中 ,能 实现 如 图 2.12 真 值 表 所 表示 的 逻辑 关系 : 仅 在 全 部 的 输入 条 件 都 具备 
( 均 为 真 ) 时 ,函数 的 输出 才 成 立 (为 真 ), 称 这 种 关系 为 "与 逻辑 ,实现 它 的 电路 称 为 与 门 。 
真 值 表 右 边 是 与 门 电路 的 符号 , 表 中 的 "1” 和 “0” 代 表 的 是 日 常生 活 中 的 * 真 "和 “ 假 "“ 是 ”和 
“ 非 ” 及 “成 立 ” 和 “不 成 立 " 等 二 值 逻辑 (Logic) ,并 不 表示 数量 的 大 小 ,而 是 表示 两 种 对 立 的 
逻辑 状态 。 

与 逻辑 的 应 用 如 某 保 险 箱 的 开启 规则 : 需要 两 位 保管 员 A 和 B 同时 到 场 ,否则 不 能 开 
启 。 设 保管 员 * 到 场 ”为 *1”, 否 则 为 “0”; 保 险 箱 开 启 ” 为 *1”, 否 则 为 “0”。 将 此 关系 填 和 人 如 
图 2. 12 所 示 的 一 张 表 中 ,此 表 就 是 这 个 保险 箱 开启 规则 的 真 值 表 。 

与 门 逻辑 可 以 用 如 下 表达 式 表示 : 
































Y=A.B 
其 中 的 %。 ”为 逻辑 “与 ”运算 符号 ,表达 式 右 边 的 A 和 B 为 自 变量 。 
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(a) 真 值 表 (b) 表达 式 (c) 逻 辑 符号 


图 2.12 与 逻辑 的 真 值 表 、 门 电路 符号 


2) 
如 
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或 门 
图 2. 13 所 示 ,能 实现 真 值 表 所 表示 的 关系 : 在 全 部 的 输入 条 件 中 只 要 有 一 个 具备 





(为 真 ) 时 ,函数 的 输出 就 成 立 (为 真 ), 称 这 种 关系 为 "或 "逻辑 。 这 种 电路 称 为 或 门 , 真 值 表 


右边 是 或 门 电路 的 符号 。 
或 门 逻辑 的 表达 式 为 























Y=A+B 
其 中 的 “十 ”为 逻辑 “或 "运算 符号 。 
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四 真 值 表 中 表达 式 (逻辑 符号 


图 2.13 或 逻辑 的 真 值 表 、 门 电路 符号 


3) 非 门 


如 图 2. 14 所 示 ,能 实现 真 值 表 所 表示 的 逻辑 求 反 的 关系 , 称 这 种 关系 为 " 非 罗 辑 。 这 


种 电路 称 为 非 门 , 真 值 表 右 边 是 非 门 电 路 的 符号 。 
非 门 逻辑 的 表达 式 为 
Y=A 
其 中 的 “一 ”为 逻辑 " 非 ” 的 运算 符号 。 


< 1 
人 


1 0 
(a) 真 值 表 (b) 表达 式 (0) 逻辑 符号 
图 2.14 非 逻 辑 的 真 值 表 、 门 电路 符号 


























选用 这 三 种 最 基本 的 逻辑 门 ( 非 门 ,与 门 . 或 门 ), 就 可 以 实现 任何 多 辑 功能 的 电路 ,包括 


组 合 迎 辑 的 电路 和 时 序 逻 辑 的 电路 。 
2. 电路 实现 举例 
如 图 2. 15 所 示 , 二 值 多 辑 的 0 和 1 在 电路 中 以 输出 电 平 电压， 
表示 ,通常 用 高 电 平 表 示 1, 用 低 电 平 表示 0。 注 意 .高 低 电 平 





Vec/Vop 
实际 是 一 个 范围 ,同样 是 高 电 平 ,但 双 极 型 的 三 极 管 和 MOS 
管 的 电 平 范围 有 所 不 同 。 

如 图 2. 16 所 示 ,为 三 极 管 实现 的 基本 门 电 路 的 原理 性 电 


路 。 由 理想 三 极 管 很 容易 地 得 出 图 2. 16(a) 为 非 门 ,图 2. 16 
(b) 和 图 2. 16(c) 分 别 为 与 门 和 或 门 。 图 2. 10 也 是 非 门 的 电 Ja 
路 实现 ,可 见 同 一 逻辑 关系 ,可 以 由 不 同 的 电路 来 实现 。 

图 2.16 的 门 电路 还 存在 一 些 如 驱动 能 力 、 运 行 速度 、 可 
靠 性 等 方面 的 问题 ,实际 应 用 的 门 电路 比 这 要 复杂 一 些 。 (SND) 一 
CMOS 电路 的 与 门 的 原理 电路 如 图 2. 17 所 示 。 be 
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(a) 非 门 (b) 与 非 门 (0) 或 非 门 
图 2.16 三 种 最 基本 门 电路 的 原理 性 电路 
































图 2.17 CMOS 电路 的 与 门 


3. 应 用 案例 
1) 与 非 门 


图 2.18(a) 是 将 一 个 与 门 和 一 个 非 门 连接 起 来 ,构成 常用 的 与 非 门 。 图 右边 是 与 非 门 
的 符号 。 同 样 ,任何 逻辑 电路 都 可 以 由 非 和 与 非 两 种 门 表示 。 
2) 或 非 门 


图 2.18(b) 是 将 一 个 或 门 和 一 个 非 门 连接 起 来 ,构成 常用 的 或 非 门 。 图 右边 是 或 非 门 
的 符号 。 任 何 逻辑 电路 都 可 以 由 非 和 或 非 两 种 门 表示 。 


本- 及 
ly a by 
Br ll | B 


(a) 与 非 门 












































(b) 或 非 门 
图 2.18 门 电路 应 用 案例 


在 计算 机 电路 中 ,通常 使 用 的 基本 逻辑 门 电路 符号 如 图 2. 19 所 示 , 仅 供 参 考 。 


数字 电路 基础 和 常用 器 件 
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图 2.19 常用 的 逻辑 门 电路 符号 


2.2.2 逻辑 函数 及 其 描述 方法 


布尔 代数 研究 二 值 巡 辑 ( 即 逻辑 代数 ) ,是 分 析 和 设计 数字 电路 的 数学 工具 ,也 是 学 习 数 
字 电 路 的 基础 。 

1. 逻辑 函数 

布尔 代数 中 输出 变量 与 输入 变量 的 逻辑 关系 称 为 逻辑 函数 , 常 写作 

F= /(A.B,C.…) 

逻辑 函数 通常 采用 表达 式 、 真 值 表 、 人 逻辑 图 \ 波 形 图 和 卡 诺 图 等 方法 表示 。 它 们 之 间 可 
以 相互 转换 。 

2. 逻辑 函数 的 描述 方法 

1) 表达 式 

由 逻辑 变量 与 逻辑 运算 符 构 成 的 数学 式 称 为 逮 辑 表达 式 。 例 如 ， 

F, = X,* YX YY, 





也 可 以 写成 
F, = X.Y, + X.Y, 
逻辑 表达 式 运 算 的 优先 顺序 依次 为 非 .与 .或 。 如 想 改变 上 式 的 运算 顺序 还 要 加 括号 。 
2) 真 值 表 


逻辑 函数 可 以 采用 表格 的 形式 表示 ,用 于 表示 输入 变量 的 各 种 可 能 取 值 与 输出 变量 对 
应 值 的 关系 ,这 种 表格 称 为 真 值 表 。 表 达 式 ,二 X,Y 十 X,Y 对 应 的 真 值 表 如 表 2. 1 所 示 。 














表 2.1 真 值 表 
X F, 
0 0 0 
0 1 1 
1 0 1 
1 1 0 








一 般 由 原始 的 逻辑 关系 可 得 到 真 值 表 。 由 真 值 表 可 写 出 相应 的 逻辑 表达 式 , 方 法 如 下 : 
先 将 输出 变量 中 取 值 为 1 的 相应 行 中 的 输入 变量 取 值 相 “ 与 ”; 青 将 上 述 各 与 项 “或 "在 
一 起 。 其 中 前 者 表示 该 行 所 满足 的 逻辑 关系 ,后 者 表示 完整 的 逻辑 关系 。 
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该 方法 通用 于 各 种 逻辑 运算 (简单 或 复杂 的 ) 关 系 。 
用 此 方法 很 容易 将 表 2. 1 的 真 值 表 转 换 成 表达 式 F, 二 XY, 十 X,Y，。 


3) 逻辑 图 


逻辑 函数 可 采用 逻辑 符号 表示 ,这 种 形式 的 逻辑 关系 称 为 逻辑 图 。 由 表达 式 F, 二 
XY 十 XX.Yn 很 容易 地 得 到 相应 的 逻辑 图 。 图 2. 20 就 是 用 与 或, 非 门 表 示 该 表达 式 的 逻 
辑 图 。 这 样 的 逻辑 关系 组 成 的 逻辑 电路 也 称 为 异 或 门 ,图 左边 是 异 或 门 的 符号 。 异 或 关系 
在 数字 电路 中 也 是 常用 的 。 


4) 波形 图 


逻辑 函数 可 采用 波形 图 表示 ,这 种 反映 入 出 变量 在 时 间 上 对 应 的 逻辑 关系 称 为 波形 图 。 
表达 式 已 ,一 XY, 十 XY, 随 时 间 对 应 的 波形 图 如 图 2. 21 所 示 。 由 波形 图 可 以 很 直观 地 看 
出 ,FE 、XY, 三 者 在 所 和 总 时刻 均 为 两 数 相 加 之 和 的 关系 。 这 样 的 加 法 称 为 半 加 (不 考虑 
低位 来 的 进位 和 向 高 位 的 进位 )。 图 2. 20 所 示 的 电路 也 称 为 半 加 器 。 
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图 2.20 半 加 器 的 逻辑 图 
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图 2. 21 


2.2.3 逻辑 函数 的 特性、 规则 与 应 用 


通常 , 某 个 逻辑 函数 的 表达 式 比 较 简单 , 则 实现 它 所 需要 的 电路 元 件 就 少 , 这 既 节 约 了 
器 材 .提高 了 电路 的 可 靠 性 ,又 有 利于 缩短 信号 的 传输 延迟 时 间 。 因 此 , 逮 辑 表达 式 的 化 简 
对 设计 逻辑 电路 是 必 不 可 少 的 。 

1. 布尔 代数 的 基本 特性 


A+1=1 
A+0=A 
A=A 
A+A=A 
A+A=1 


A。0=0 
A "1=A 


A.A=A 
A.A=0 


交换 律 : A 十 B=B 十 A 
结合 律 : (A 十 B) 十 C=A 十 (B 十 C) 


(A 


B)C=A(BC) 


A*B=B*A 


分 配 律 : A(B 十 C)=AB 二 AC 
反 演 律 ( 德 . 摩根 律 ): AB==A 十 B 。 A+ 


吸收 律 : A+ 
A+ 


HAB=A 
HAB=A+B 


2. 三 个 重要 的 规则 


1) 代入 规 见 





HB=AB 


A(A+B)= 


AB 





(A++B)(A+ 


FO)=A+BC 


b 


半 加 器 的 波形 图 
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用 一 个 逻辑 函数 替代 逻辑 等 式 两 边 所 有 的 某 一 变量 , 则 等 式 仍然 成 立 。 
例 : 化 简 下 二 XYZ 十 X(YZ), 设 互 一 YZ ,根据 代入 规则 有 
F= XH+XH=X 
2) 反 演 规则 
对 函数 下 中 所 有 的 变量 取 反 、 与 变 或 或 变 与 .0 变 1.1 与 0, 即 得 到 其 反 函数 下。 
例 : ,二 处 ,。 了, 十,* YY, ,根据 反 演 规则 可 得 到 它 的 反 函数 为 
F. = (X.Y.). (X,Y.) 
注意 : 在 使 用 反 演 规则 时 , 原 有 运算 顺序 必须 保持 不 变 , 必 要 时 可 以 加 括号 。 
原 函 数 ,二 XX,， 部 ,十 六,。 YY, 的 表达 式 中 ,有 (X。*,) 和 ( 久 ,。YY,) 两 个 与 项 ,然后 再 
将 两 个 与 项 相 或 , 称 这 种 由 若干 个 与 项 相 或 形式 组 成 的 表达 式 为 与 或 式 , 这 是 逻辑 代数 中 最 
常见 的 逻辑 函数 表达 式 。 
3) 对 偶 规则 
将 函数 下 中 与 变 为 或 .或 变 为 与 .0 变 为 1.1 变 为 0, 即 得 到 一 个 新 的 函数 FF ,并 称 下 为 
下 的 对 偶 式 。 当 某 一 等 式 成 立 , 则 它 的 对 偶 式 也 成 立 。 
例 : 记 = 二 用 (A,B,C),F: 二 A 十 BC, 且 五 =F2; 现 有 到 '==f1'(A,B,C) 为 Fi 的 对 偶 
式 ,Fs'= 二 A(B 十 C) ,证 明 Fl =F,。 
因为 A(B 十 C) 是 A 十 BC 的 对 偶 式 , 所 以 Fs 为 Fi 的 对 偶 式 , 且 已 知 Fi 为 下 的 对 
偶 式 。 
又 因 亚 王 Fas ,由 对 偶 规则 ,所 以 F1 一 Fz 成 立 。 
3. 与 或 式 的 化 简 
逻辑 函数 的 化 简 有 公式 化 简 、 卡 诺 图 (Karnaugh Map) 化 简 ( 图 解 化 简 ) 和 表格 化 简 (Q- 
M 化 简 )3 种 方法 。 由 于 通常 情况 下 通过 工程 软件 可 以 优化 (自动 化 简 ) ,所 以 作为 原理 此 处 
仅 讨论 公式 化 简 。 其 他 化 简 方 法 可 参考 有 关 书 籍 的 相关 内 容 。 
通常 一 个 逻辑 函数 所 对 应 的 逻辑 表达 式 不 唯一 ,因而 这 些 表达 式 的 繁 简 程 度 也 各 异 。 
一 般 对 于 不 同类 型 的 表达 式 而 言 ,“ 简 单 ” 的 标准 也 各 不 相同 。 就 常见 的 与 或 表达 式 而 言 ， 
“最 简 ” 的 含义 指 该 表达 式 与 项 个 数 最 少 ,并 且 各 与 项 所 含 的 变量 个 数 也 最 少 。 
运用 逻辑 代数 的 特性 对 表达 式 进 行 化 简称 为 公式 化 简 。 
例 : 运用 A 十 A==1. 可 以 将 两 项 合并 为 一 项 ,从 而 消去 一 个 变量 ,使 
ABC+ ABC = AB (C+OC) = AB 
例 : 运用 A 十 AB==A 十 B, 可 以 消去 多 余 的 因子 .使 
A+AB+DE = A+B+DE 
例 : 运用 A 十 AB==A, 可 以 吸收 多 余 的 项 ,使 
AB+ABCD(E+F)= AB 


2.3 ”组 合 逻 辑 电 路 及 时 序 逻 辑 电 路 
数字 电路 通常 由 组 合 罗 辑 电 路 (Combinational Logic Circuit) 和 时 序 逻 辑 电路 


(CSequential Logic Circuit) 组 成 。 组 合 逻 辑 电 路 中 , 任 一 时 刻 电 路 的 输出 状态 仅 与 当前 输入 
信号 的 状态 有 关 , 与 电路 原来 的 输出 状态 无 关 , 没 有 记忆 功能 。 其 电路 结构 为 信号 从 输入 端 
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逐 级 向 输出 端 传输 ,没有 后 级 向 前 级 的 反馈 。 

本 节 给 出 常用 的 实现 组 合 逻 辑 功能 的 中 小 规模 集成 电路 ,包括 它们 的 器 件 功能 . 引 脚 分 
配 等 内 容 。 
2.3.1 常用 浸 辑 门 器 件 

1. 基本 逻辑 门 

在 教学 计算 机 中 选用 的 基本 逻辑 门 有 非 门 .与 ( 非 ) 门 等 ,型 号 为 6 反 相 器 SN74LS04、4- 
2 输入 正 与 非 门 SN74LS00 .4-2 输入 正 与 门 SN74LS08, 如 图 2. 22 所 示 。 用 于 实现 信号 反 
相 ( 变 极 性 ) 或 最 简单 的 逻辑 处 理 功能 。 
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图 2.22 基本 逻辑 门 电路 





















































2. 三 态 门 器 件 

三 态 门 是 具有 3 个 输出 状态 的 逻辑 电路 . 比 二 值 逻辑 电路 多 一 个 高 阻 状态 Z. 是 常用 的 
总 线 接口 电路 。 其 功能 和 电路 符号 如 图 2. 23 所 示 。 

三 态 电路 的 输出 状态 是 通过 一 个 输入 G 控制 的 。 当 G 为 低 ( 有 效 ) 时 ,三 态 电 路 的 输出 
取决 于 输入 状态 ,给 出 正常 的 0 或 1 输出 ; 当 G 为 1 时 ,输出 为 高 阻 态 。 图 2.23(a) 中 的 Xx 








数字 电路 基础 和 沛 用 器 伴 
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(a) 功能 表 (b) 图 形 符号 


图 2.23 三 态 与 非 门 的 功能 表 与 符号 


表示 随意 态 ,其 值 为 0 或 为 1 均 可 。 

三 态 电路 最 重要 的 应 用 是 构成 硬件 中 总 线 的 接收 器 和 发 送 器 。 常 用 的 有 实现 单 向 传送 
功能 的 SN74LS240 和 SN74LS244, 二 者 的 数据 线 引 脚 分 配 相 同 , 但 前 者 入 出 的 极 性 相反 ， 
后 者 入 出 的 极 性 相同 ,两 部 分 的 4 位 数据 分 别 由 2G 和 1G 控制 输出 是 否 高 阻 态 。 还 有 实现 
双向 传送 功能 的 SN74LS245, 分别 由 CG 和 DIR 控制 A 与 B 是 否 连通 以 及 信息 传送 方向 。 
器 件 的 内 部 逻辑 关系 和 外 部 数据 线 引 脚 如 图 2. 24 所 示 。 


je 小 人 
20}-—{191—{18 17E Nie dis i413 2 11 


el Bo a We ee 


Lif 


1 过 3 和 [4 庆 5 6 六 7 8s 产 To 
I 1 2 1 2 ly 2 lM 2% GND 
(a) SN74LS244 




















































































































































































































和 Bi 
18|—{17H i615 N14 
a 4 1 + + 
ou lll A 


认 从 
人 
DIR 4 4 小 44 A; 46 4 4: GND 


(a) SN74LS245 





















































































































































图 2.24 SN74LS244 和 SN74LS245 的 引 脚 图 


3. 多 路 选择 器 

多 路 选择 器 又 称 多 路 开关 ,实现 从 多 路 的 输入 数据 中 选择 一 路 作为 输出 的 功能 。 教 学 
计算 机 中 选用 了 4 位 带 有 三 态 输出 控制 的 SN74LS257 器 件 , 如 图 2. 25 所 示 。 

输入 选择 控制 信号 S, 用 于 选择 将 A 路 输入 还 是 B 路 输入 送 到 输出 。 当 S 为 低 时 , 输 
出 来 自 A 路 输入 ,反之 来 自己 路 输入 。 输 出 控制 信号 G 为 低 , 被 选中 的 4 位 输出 为 正常 逻 
辑 电 平 ,反之 则 输出 高 阻 态 。 
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G 44 48 4Y 34 38 输入 端 输出 
S 37 ra 
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(a) 引 脚 图 (b) 功能 表 





图 2.25 SN74LS257 引 脚 图 与 功能 表 


4。 编码 器 和 译 码 器 

计算 机 中 的 信息 大 都 是 被 编码 的 。 编 码 器 是 把 输入 信号 转换 成 需要 的 编码 。 一 般 是 把 
2" 个 输入 信号 不 同 的 状态 组 合 , 按 预先 规定 的 优先 级 ,编码 成 位 输出 信号 。 编 码 器 的 种 类 
很 多 ,计算 机 中 常用 到 优先 编码 器 ,例如 SN74LS148 优先 编码 器 。 该 编码 器 有 8 位 输入 、3 
位 输出 ,功能 表 如 图 2.26 所 示 。 

EI( 低 有 效 ) 为 编码 控制 信号 ,EO、GS 为 输出 状态 信号 ,用 于 实现 多 个 同类 器 件 之 间 的 
级 联 。 仅 当 EI 为 低 , 编 码 器 才 进 行 识别 与 编码 。 当 8 位 输入 从 右 向 左 遇 到 第 1 个 低 , 另 7 位 
可 能 为 高 或 低 时 ,编码 器 才 输 出 正常 的 3 位 编码 (对 应 输入 从 右 向 左 第 1 个 低 优先 ) ,此 时 
GS 和 EO 为 01, 表 明 编 码 有 效 。 

若 8 位 输入 均 为 高 .或 EI 为 高 ,编码 器 3 位 输出 均 为 高 。 并 通过 GS 和 EO 为 10 或 11 来 
表明 两 种 不 同情 形 。 









































Inputs Outputs 
BINiERLE | 7 
HX EIN HI 
ps 16L- re LIHHHHHHHHIBIH HHIL 
天 柳 LX 基 项 区 本 证 | 和 | 王 , 正 王 | 王 
?2 15 20 上 
A Lixxxxx LHHILIL HL|H 
L144 ¥ 13F2 上 
Es 5 12FE LIXX LE HEHYH HILIL L HIH 
ZH6 s 1 上 lx- LE HR HILAR 
0 LIxLHHHHHHILIL HHIH 
GND-8 SE LILHHHHHHHILIH HHIH 
H= 高 电 平 “L= 低 电 平 x= 任 意 
(a) 引 脚 图 (b) 功能 


图 2.26 SN74LS148 引 脚 图 与 功能 表 


译 码 是 编码 的 逆 过 程 ,即将 输入 的 编码 转换 成 原来 的 信号 表示 。 与 编码 器 一 样 , 译 
码 器 的 种 类 也 很 多 ,计算 机 中 常用 于 把 一 组 输入 代码 的 状态 组 合 翻译 成 相应 的 控制 电 
位 。 若 输入 信号 有 ?7 个 ,其 输出 最 多 可 以 有 2" 个 。 正 常 输出 时 ,2" 个 输出 中 仅 有 一 个 输出 
为 低 ( 或 高 ) ,其 他 2" 一 1 个 输出 均 为 高 (或 低 ), 用 于 表明 nn 个 输入 的 某 一 种 状态 组 合 ;不 
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需要 译 码 时 ,通过 另外 的 控制 信号 可 以 使 输出 全 部 为 高 ( 低 ) ,用 于 表明 不 选择 任何 输入 
状态 组 合 。 教 学 计算 机 中 ,选用 了 有 3 个 输入 信号 .8 个 (2 ) 输 出 信号 ( 低 有 效 ) 的 
SN74LS138 译 码 器 ( 常 称 3-8 译 码 器 ) ,也 选用 了 双 路 的 各 有 2 个 输入 信号 、4 个 (2 ) 输 出 信 
号 ( 低 有 效 ) 的 双 2-4 译 码 器 SN74LS139。 它 们 的 引 脚 、 内 部 逻辑 与 功能 表 如 图 2. 27 所 示 。 






















































































数据 输出 端 选择 数据 输出 端 
克 许 一 一 ry 
Fc hh F % 万 % YY 天 Vc 26G 24 28 20 2 22 2 
16L OLED 9 16L 05354033H2IOEoF9 
G 4 有 区 YY Y 
冲 王 



















































































































































































2FT3F4 1LFT2FT3F4P 站 OFFTY 

4 BB CO Gy Go 9 态 GND IG 14 18 WY In WY 1 GND 

= 全 J C= 

选择 人 允许 输出 允许 议 择 数据 给 出 喘 

(a) SN74LS138 引 脚 图 (b) SN74LS139 引 脚 图 
输入 端 
人 允许 | 选择 输出 庙 
G GC 8 4|%P EEYYY» 
x Hi|xxxlHHHHHHHH 
L x |xx xlIHHHHHHHH - 
HLILLLIlILinHHHHHH 输入 端 输出 只 
H LILL HIHLHHHHHIH 克 许 | 选择 二 
H LILHLIHHLHHHHH G 18 4%n 
HL ILHHIHHHLHHHH H |x xlIlHHHH 
HLIHL LIHFHHHLHHH I | 
HL|IHLHIHHHHHLHH L LHIHLHH 
H LIHHLIHHHHHHLH 1 HLIHHLH 
HL IHH HIHHHHHHHI L HHIHHHL 
“GGyt Gp 
(c) SN74LS138 功 能 表 (d) SN74LS139 功 能 表 


图 2.27 译 码 器 SN74LS138 和 SN74LS139 的 引 脚 图 与 功能 表 


2.3.2 时 序 水 和 辑 电路 


1. 基本 R-S 触发 器 和 锁 存 器 

计算 机 系统 能 够 自动 并 协调 一 致 地 工作 ,是 在 控制 器 控制 下 严格 地 按时 序 工作 ,时 序 电 
路 是 计算 机 电路 中 的 重要 组 成 部 分 。 它 的 特点 是 任 一 时 刻 , 电 路 的 输出 ,不 仅 与 该 时 刻 的 输 
入 有 关 , 还 与 电路 以 前 的 状态 有 关 ( 即 有 记忆 功能 ) 。 

教学 计算 机 中 使 用 了 R-S 触发 器 .D 触发 器 等 ,触发 器 是 构成 时 序 电 路 的 基本 部 件 ,也 
是 计算 机 中 最 常用 的 记忆 逻辑 电路 。 

基本 R-S 触发 器 (Filp Flop) 的 组 成 : 它 可 由 2 个 与 非 门 (或 者 2 个 或 非 门 ) 交 又 连接 而 
成 ,如 图 2. 28 所 示 , 可 存放 1 位 二 进 制 信息 。 输 出 端 Q 的 值 与 存放 的 二 进 制 信息 对 应 ,Q 为 
反 相 输出 端 ,输入 S(Set) 为 置 位 端 , 男 一 输入 及 (Reset) 为 复位 端 。 
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由 于 输入 低 有 效 ,参照 连接 图 、 真 值 表 和 波形 图 很 容易 分 析 。 









































2 2 
上 二 5 RK |00| 功 能 
3G 吧 G x Hn 1 工 | 不 变 | 保持 
i HL 1 0 |01| 复 位 
| | oH oa 
5 1 1 0 0 | 不 定 | 失效 
二 1 | 
(a) 逻辑 图 (b) 波形 图 (c) 真 值 表 


图 2.28 基本 R-S 触发 器 


可 以 对 R-S 触发 器 稍 加 修改 构造 出 锁 存 器 (Latch) 。 

在 基本 R-S 触发 器 电路 上 加 3 个 门 电路 ,如 图 2. 29 所 示 , 使 数据 接收 端 D 仅 1 个 ,并 
增加 1 位 控制 信号 玉 。E 为 低 时 ,触发 器 状态 保持 不 变 , 只 有 顾 为 高 ,输出 才能 随 输入 而 变 。 
通常 称 这 种 触发 器 为 锁 存 器 ,在 计算 机 中 用 于 组 成 暂 存 器 。 






















































































o 2 
pr 功能 表 
人 & 到 
名 | 包 五 万 |2 2 j= a 
ti oi | io 2 5 po by 
二 De | 0 DE vn Tt 
Dp E UR Ee pl! UL LT 
(a) 逻辑 图 和 功能 表 (b) 图 形 符号 (0) 典型 波形 图 
图 2.29 锁 存 器 


2. D 型 触发 器 .寄存 器 与 计数 器 器 件 

(1) 基本 R-S 触发 器 存在 不 允许 2 个 输入 端 同时 为 0、 接 收 数据 期 间 也 不 允许 输入 端 数 
据 发 生变 化 和 没有 时 钟 控制 等 缺陷 。 在 此 基础 上 再 加 几 个 按 一 定 关系 连接 的 与 非 门 就 组 成 
比较 完善 的 DD 触发 器 ,如 图 2. 30 (d) 所 示 。 在 D 型 触发 器 接收 输入 时 自身 具有 维持 阻塞 
功能 ,可 以 保证 把 自己 的 输出 正常 送出 并 同时 接收 新 的 输入 数据 ,这 是 实现 寄存 器 内 容 移 位 
和 计数 功能 所 需要 的 。 

D 触发 器 常用 于 构成 计算 机 中 的 寄存 器 和 数据 缓冲 器 。 它 的 逻辑 符号 .激励 表 和 波形 
图 如 图 2.30(a) (b) 和 (c) 所 示 , 其 逻辑 符号 中 的 CP 表示 时 钟 脉冲 输入 信和 号.D 触发 器 的 状 
态 是 在 CP 脉冲 的 上 升 沿 做 相应 转换 的 , 即 此 时 输入 端 D 的 数据 传 到 输出 端 ,Q" 是 它 的 现 
态 ( 原 来 状态 ),Q"™! 是 它 的 次 态 ( 时 钟 脉冲 上 升 沿 作 用 下 将 要 转换 的 状态 ) ,Ro 和 So 为 直接 
清 0、 置 1 端 , 即 不 需要 时 钟 脉冲 的 作用 就 可 以 改变 触发 器 的 状态 ,用 于 对 触发 器 清 0 和 预 
置 数据 。 

D 型 触发 器 可 以 单独 使 用 ,也 可 以 把 多 个 D 型 触发 器 合成 一 个 部 件 使 用 ,从 而 形成 接 
收 与 发 送 多 位 数据 的 寄存 器 ,或 带 有 移 位 操作 功能 的 移 位 寄存 器 ,或 带 有 计数 功能 的 进位 计 
数 器 等 。 从 实际 使 用 的 功能 需求 考虑 .还 可 以 加 上 对 和 触发 器 输入 和 输出 控制 的 功能 以 及 对 
部 件 内 多 位 数据 共同 清 *0” 控 制 的 功能 等 。 
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(a) 逻辑 符号 (b) 波形 图 (c) 真 值 表 
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(d) 电路 组 成 
图 2.30 D 型 触发 器 


(2) 寄存 器 (Register) 。 在 教学 计算 机 内 部 选用 了 3 种 型 号 与 用 途 不 同 的 寄存 器 ,它们 
是 SN74LS377、SN74LS374 和 SN74LS273。 

它们 的 管 脚 分 配 基本 一 致 .都 有 8 个 数据 输入 和 8 个 数据 输出 ;都 使 用 一 个 时 钟 输入 信 
号 ( 引 脚 11) ,只 是 管 脚 1 的 控制 功能 有 一 些 差别 ; 内 部 组 成 和 功能 外 特性 有 某 些 差别 。 教 
学 计算 机 系统 中 ,3 种 类 型 的 寄存 器 被 使 用 在 不 同 的 场合 。SN74LS374 等 器 件 的 内 部 组 成 
和 引 脚 分 配 如 图 2. 31 所 示 。 

除 此 之 外 ,还 选用 了 一 片 计数 器 芯片 SN74LS161。 这 是 一 个 4 位 的 二 进 制 同 步 计数 器 
器 件 , 同 步 指 的 是 4 位 触发 器 在 同一 个 时 钟 脉冲 信号 作用 下 同时 翻转 。 

该 器 件 有 一 个 清 零 输 入 端 CLR, 当 它 为 低 电 平时 (此 时 两 个 计数 允许 控制 端 都 应 为 低 
电 平 状态 , 置 和 人 控制 端 为 高 电 平 状态 ) ,时 钟 脉冲 的 正 跳 沿 将 对 4 个 触发 器 清 零 。 

SN74LS161 有 一 个 预 置 输入 端 , 当 其 为 低 电 平 时 (此 时 两 个 计数 允许 控制 端 都 应 为 低 
电 平 状态 , 清 零 控制 端 为 高 电 平 状态 ) ,时 钟 脉冲 的 正 跳 沿 将 把 4 个 触发 器 的 输入 信号 A、 
B.C.D 接收 到 4 个 触发 器 中 ,这 被 称 为 计数 初始 状态 预 置 功能 。 

SN74LS161 还 有 两 个 计数 允许 控制 端 已 和 T 工 。 当 它们 为 高 电 平时 , 且 预 置 输入 端 、 清 
除 输入 端 也 都 为 高 电 平 ,时 钟 脉冲 信号 将 对 4 个 触发 器 按 二 进 制 规则 进行 计数 操作 。 而 当 
PP 和 T 处 于 不 同 状态 时 ,SN74SL161 器 件 处 于 禁止 运行 方式 , 既 不 能 进行 预 置 操作 ,也 不 能 
进行 计数 操作 。 
2.3.3 存储 器 芯片 简介 


教学 计算 机 的 内 存储 器 由 只 读 存储 区 和 随机 读 写 存储 区 两 部 分 组 成 ,都 选用 静态 存储 
器 芯片 实现 。 随 机 读 写 存 储 区 的 容量 通常 选 定 为 2K 字 , 由 2 片 随机 读 写 的 2KX8 位 的 
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(a) 内 部 结构 和 引 脚 图 
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(b) SN74LS377 功 能 表 (c) SN74LS374 功 能 表 

(a 时 钟 输入 D 

L x x 

H + H H 

H + L L 

H EL x 0 

















(d) SN74LS273 功 能 表 
图 2.31 SN74LS374 等 器 件 的 内 部 组 成 和 引 脚 


6116 存储 器 芯片 组 成 。1K 王 1024。 

只 读 存 储 区 的 容量 通常 选 定 为 8K 字 .16 位 机 由 2 片 可 编程 的 8KX8 位 的 型 号 为 
28C64( 或 58C65) 的 EEPROM 静态 存储 器 芯片 组 成 。EEPROM 可 以 用 专门 的 可 编程 仪器 
探 除 或 写 入 .而 教学 计算 机 能 够 对 它 直 接 完成 擦 除 与 写 和 操作。 

存储 器 芯片 的 内 部 组 成 和 读 写 原理 将 在 第 7 章 中 讲解 。 图 2. 32(c)、(d) 给 出 它们 的 引 
脚 图 ,以 方便 查看 。 


2.3.4 几 个 专用 功能 器 件 和 存储 器 共 片 的 引 脚 图 


在 教学 计算 机 系统 中 ,在 运算 器 部 件 中 选用 了 Am2901 器 件 .在 控制 器 部 件 中 使 选用 
了 Am2910 器 件 , 在 输入 /输出 接口 中 选用 了 串 行 接口 Intel 8251 和 并 行 接口 Intel 8255 器 
件 。 这 几 个 芯片 的 内 部 组 成 和 实现 的 功能 都 比较 复杂 ,将 在 用 到 它们 的 有 关 章 节 中 分 别 讲 
解 。 这 里 给 出 它们 的 引 脚 分 配 如 图 2. 32(a) (b) 、(fD) (Cg) 所 示 。 
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图 2.32 几 个 专用 器 件 的 引 脚 分 配 图 
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2.4 ”现场 可 编程 逻辑 器 件 及 其 应 用 


计算 机 的 发 展 与 微 电 子 技术 的 发 展 紧密 相关 ,前 述 的 74 系列 芯片 是 标准 的 器 件 , 用 
户 不 能 改变 其 中 的 逻辑 。 新 型 集成 电路 可 编程 逻辑 器 件 PLD (Programmable Logic 
Device) ,用 户 可 以 在 此 芯片 上 实现 自己 的 逻辑 设计 。 教 学 计算 机 设计 中 ,选用 了 包括 
GAL( 通 用 阵列 逻辑 ) .CPLD(Complex PLD) ,FPGA (Field Programmable Gate Array) 等 ， 
用 于 实现 某 些 组 合 逻 辑 电 路 .时序 逻辑 电路 、 控 制 器 中 控制 信号 产生 电路 CU, 甚 至 完整 
的 CPU 系统 功能 。 这 些 可 编程 器 件 对 提高 教学 计算 机 系统 的 实验 功能 发 挥 着 重要 的 
作用 。 


2.4.1 现场 可 编程 器 件 概述 


PLD 芯片 中 有 大 量 的 逻辑 门 或 基本 的 通用 功能 模块 以 及 可 编程 开关 ”。 通 过 对 这 些 
开关 的 编程 ,可 以 实现 逻辑 门 或 功能 模块 间 的 不 同 连 接 , 以 实现 用 户 的 逻辑 电路 。 

1. GAL 的 基本 原理 

以 GAL20V8 为 例 介绍 ,芯片 的 引 脚 如 图 2. 33 所 示 , 其 内 部 主要 由 双 缓 冲 、 与 阵列 、 输 
出 逻辑 宏 单 元 和 三 态 门 等 组 成 。 

双 缓 冲 是 将 单一 输入 转换 成 原 变量 和 反 变 量 输入 的 器 件 。 图 2. 34 上 方 有 三 个 双 缓 冲 。 
双 缓冲 在 迎 辑 设计 时 用 到 原 . 反 变量 时 发 挥 了 很 重要 的 作用 。GAL20V8 芯片 最 多 有 20 个 
输入 ,对 应 有 20 个 双 缓 冲 。 

与 阵列 也 称 为 乘积 项 (Product Term) ,是 由 与 门 阵列 构成 的 完成 与 运算 的 逻辑 电路 ,如 
图 2.34 所 示 。 图 2.34 中 有 3 个 与 门 ,每 个 与 门 有 6 个 输入 ( 原 . 反 变量 各 3 个 ) ,其 中 Za 实 
现 了 Zs 二 A，B.C 的 逻辑 功能 。 GAL20V8 芯片 共有 8 个 与 门 阵列 组 ,每 组 有 8 个 与 门 ， 
每 个 与 门 有 40 个 输入 。 
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图 2.33 GAL20V8 引 脚 图 图 2.34 与 阵列 原理 图 


输出 逻辑 宏 单元 (Output Logic Macro CelD) 是 GAL 成 为 通用 器 件 的 关键 部 件 ,其 内 部 
简化 逻辑 如 图 2. 35 所 示 ,其 中 的 或 门 用 于 或 运算 ; 异 或 门 用 于 对 或 门 输出 的 信号 是 否 反 相 ; 
D 触发 器 作 寄 存 器 ;多 路 控制 用 于 各 种 灵活 的 控制 ;根据 实际 需要 可 以 将 运算 后 的 信息 反馈 
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回 和 输入 或 将 输出 引 脚 作 输入 用 ;每 路 输出 都 是 三 态 可 控 的 。 作 时 序 控制 时 还 可 提供 时 钟 


信号 。 
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图 2.35 输出 逻辑 宏 单元 原理 图 


2. CPLD 与 FPGA 芯片 简介 

MACH(Macro Array CMOS High-density) 是 在 PAL 和 PALCE( 相 当 于 GAL) 结 构 
基础 上 发 展 起 来 的 复杂 的 CPLD 器 件 , 采 用 CMOS 电 可 擦 工 艺 制造 ,具有 连续 式 的 内 部 连 
线 结构 ,可 以 预知 内 部 逻辑 的 定时 关系 ,容易 消除 竞争 现象 。 具 有 通用 的 设计 工具 ,可 选择 
ABEL(Advanced Bool Expression Language) 或 VHDL (Very High Speed Integrated 
Circuit Hardware Description Language) 语 言 描述 设计 对 象 的 组 成 与 功能 ,并 支持 在 系统 编 
程 , 关 掉 电源 不 会 使 内 部 的 逻辑 信息 丢失 ,便于 设计 使 用 。 

MACH 系列 的 高 端 器 件 内 部 由 多 个 优化 PAL 块 和 一 个 中 央 开 关 和 矩阵 互 连 而 成 。 其 内 
部 的 PAL 块 类 似 于 独立 的 PAL 器 件 , 它 们 之 间 的 通信 通过 中 央 开 关 和 矩阵 实现 。 每 个 PAL 
块 由 输入 开关 矩阵 .时 钟 发 生 器 .乘积 项 阵列 .逻辑 分 配器 、 宏 单元 .输出 开关 矩阵 和 IO 单 
元 组 成 。 每 个 PAL 块 内 又 含有 多 个 宏 单 元 , 既 有 输出 宏 单 元 ,又 有 隐 埋 (Buried) 宏 单元 。 
中 央 开 关 矩 阵 为 PAL 块 的 信号 输入 和 块 间 通信 提供 通路 。 

现场 可 编程 门 阵列 (FPGA) 是 近 些 年 来 出 现 并 开始 被 广泛 应 用 的 大 规模 集成 电路 器 
件 。 但 是 其 内 部 结构 是 采用 许多 个 独立 的 可 编程 的 逻辑 模块 (Configurable Logic Block， 
CLB) .输入 输出 模块 (1/O Block.IOB) 和 互 连 资源 (Interconnect Resource)3 部 分 组 成 。 该 
器 件 的 特点 包括 以 下 5 个 方面 。 

(1) 与 IOB 相连 的 输入 输出 引 脚 数量 更 多 ,并 可 根据 需要 设置 为 输入 或 输出 端 。 

(2) 内 部 的 每 一 个 CLB 的 电路 中 都 包含 组 合 逻 辑 电 路 .1 一 2 个 触发 器 电路 和 一 些 数据 
选择 器 电路 ,可 根据 需要 实现 组 合 逻 辑 的 功能 .例如 1 个 4 变量 的 组 合 逻辑 函数 .2 个 3 变 
量 的 组 合 逻辑 函数 ,1 个 5 变量 的 组 合 逻 辑 函 数 。 也 可 以 实现 时 序 逻 辑 的 功能 , 即 把 触发 器 
编程 为 边沿 触发 的 DD 触发 器 ,或 者 电 平 触发 的 D 型 锁 存 器 ,可 以 使 其 运行 于 同步 方式 (使 用 
公用 的 CLK 时 钟 信号 ) 或 异步 方式 (使 用 1 个 特定 数据 输入 端 作为 时 钟 ), 触 发 器 接收 的 数 
据 来 自 组 合 逻 辑 部 分 的 输出 。 

(3) 内 部 的 互 连 资源 由 金属 线 、 开 关 阵 列 和 可 编程 连接 点 3 部 分 构成 ,用 于 实现 把 数量 
很 大 的 CLB 和 IOB 相互 连接 起 来 以 构成 不 同 的 复杂 系统 。 

(4) FPGA 芯片 的 工作 状态 (提供 的 逻辑 功能 ) 是 由 芯片 内 的 编程 数据 存储 器 设 定 , 该 
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存储 器 中 的 内 容 在 断 电 后 不 被 保存 ,因此 必须 在 每 次 加 电 时 被 重新 装 和 人 ,这 是 在 芯片 内 的 一 
个 时 序 电路 控制 下 自动 完成 的 。 被 装 人 的 数据 通常 要 存放 在 芯片 之 外 的 一 片 EPROM 器 
件 中 。 其 优点 是 编程 使 用 更 加 灵活 ,缺点 是 丢掉 了 数据 加 密 功能 。 

(5) 可 使 用 更 高 层次 的 工具 软件 ,通常 可 选用 VHDL 语言 来 描述 设计 对 象 的 组 成 与 功 
能 (结构 与 行为 ) 。 

例如 ,Xinlinx 公司 的 SPARTAN-[[ 系 列 型 号 为 XC2S200 的 芯片 ,208 脚 的 PQFP 封装 形 
式 , 有 20 万 门 容量 ,芯片 内 有 2352 个 CLB, 可 支持 在 系统 编程 (In-system Programmable) ,很 适 
合 于 用 它 实现 一 个 简单 的 CPU。 片 内 还 有 14 个 4Kb 的 存储 器 电路 ,还 可 以 用 其 内 部 的 触发 
器 资源 构建 一 个 小 容量 的 存储 器 。 

FPGA 结构 简化 模型 由 4 种 类 型 的 模块 组 成 : 二 维 逻 辑 阵 列 、 互 连 资源 、 内 榜 存储 器 结 
构 和 输入 输出 等 模块 ,如 图 2. 36 所 示 。 
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图 2.36 CPLD/FPGA 结构 原理 图 


二 维 逻 辑 阵 列 模块 (与 .或 阵列 ) 是 可 编程 逮 辑 的 主体 ,用 于 完成 不 同 的 逻辑 功能 ; 互 连 
资源 模块 连接 所 有 的 二 维 逻 辑 阵列 和 输入 输出 模块 ;内 艇 存储 器 结构 可 以 在 芯片 内 存储 数 
据 ; 输 入 输出 模块 是 芯片 与 外 界 的 接口 ,完成 不 同 要 求 的 输入 输出 功能 。 

CPLD 与 FPGA 的 内 部 结构 也 各 不 相同 ,通常 CPLD 基于 与 .或 阵列 结构 ,组 合 逻辑 资 
源 较 丰 富 ,虽然 也 有 类 似 于 OLMC 结构 的 宏 单元 ,但 内 部 寄存 器 相对 不 够 丰富 ,所 以 较 适 合 
设计 组 合 罗 辑 较 多 的 电路 ;FPGA 的 二 维 逻 辑 阵 列 基于 查找 表 (LookUp Table) 结 构 , 如 
图 2.37 所 示 , 寄 存 器 资源 比较 丰富 .因此 也 适合 设计 时 序 逻 辑 较 多 的 电路 。CPLD 与 
FPGA 最 大 的 差别 是 CPLD 编程 后 信息 同 ROM 一 样 , 断 电 后 信息 仍 保留 ;而 FPGA 编程 


























































































































4 二 一 4 
oh 1 让 站 IF 
O01 0 0 0 1 
ol Ee 0 0 1|0 
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(a) 2 输入 的 查找 表 (b) 对 查找 表 编程 (©) F=4°B+4A°B 


图 2.37 FPGA 的 查找 表 结构 原理 图 
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后 , 断 电信 息 即 丢失 。 因 此 ,可 以 将 所 需 信 息 ( 代 码 或 数据 ) 事 先 存 人 FPGA 芯片 外 ,可 选 购 
的 EPROM 中 ,在 每 次 开机 时 自动 将 所 需 信息 装 入 FPGA ,否则 开机 时 必须 通过 计算 机 对 
FPGA 重新 下 载 所 需 信息 。 另 外 ,FPGA 的 优点 是 编程 使 用 更 加 灵活 ,缺点 是 丢掉 了 数据 加 
密 功能 。 


2.4.2 CPLD 和 FPGA 的 编程 与 应 用 


教学 计算 机 中 组 合 逻辑 控制 器 的 控制 信号 产生 部 件 是 由 MACH (高 密度 宏 阵 列 
CMOS) 器 件 实现 的 ,MACH 属于 CPLD。 

教学 计算 机 中 ,也 用 FPGA 芯片 实现 了 一 个 完整 的 CPU 系统 。 

这 两 类 器 件 的 编程 设计 大 致 可 分 为 以 下 几 个 步 又。 

(1) 设计 输入 。 可 采用 电 原 理 图 方式 输入 ,也 可 用 ABEL 语言 或 VHDL 等 硬件 描述 语 
言 的 文本 方式 输入 。 

(2) 编译 ,综合 和 优化 。 

(3) 功能 仿真 (或 称 功能 模拟 )。 通 过 仿真 软件 验证 设计 的 正确 性 。 

(4) 适 配 。 将 设计 映射 在 器 件 上 ,进行 布局 和 布线 ,形成 编程 用 的 JEDEC 文件 。 

(5) 定时 分 析 和 仿真 (或 称 布线 后 模拟 ) 。 利 用 仿真 软件 验证 器 件 在 要 求 的 频率 上 能 否 
正常 工作 。 

(6) 对 器 件 进 行 编程 。 

用 于 这 两 类 器 件 的 工具 软件 的 使 用 和 设计 过 程 ,请 参见 有 关 技术 资料 。 


本 章 内 容 小 结 和 学 习 方法 建议 


本 童 作为 计算 机 组 成 原理 课 的 先 修 知识 ,每 个 人 应 根据 自己 的 实际 情况 ,可 以 采用 不 
学 、 适 当 补 修 、 认 真 学 习 等 不 同 的 方案 处 理 。 主 要 目标 是 理解 晶体 二 极 管 三 极 管 ( 双 极 型 ) 
和 MOS 管 的 开关 特性 及 其 在 计算 机 中 的 基本 应 用 ;理解 基本 逮 辑 门 及 其 基本 退 辑 电路 的 
基本 描述 或 表示 方法 ,并 在 常用 公式 和 基本 规则 的 基础 上 ,进行 简单 逮 辑 设计 、 逮 辑 化 简 等 ; 
掌握 组 合 逻 辑 电 路 和 时 序 逻 辑 电路 的 特点 与 区 别 ; 了 解 常用 组 合 逻 辑 电 路 与 常用 时 序 电 路 ， 
以 及 最 常用 的 中 小 规模 逻辑 电路 在 计算 机 组 成 ,特别 是 其 在 教学 计算 机 中 的 应 用 ;了 解 现 场 
可 编程 逻辑 器 件 的 内 部 组 成 和 使 用 特性 ,了 解 其 简单 编程 和 设计 过 程 。 

本 章 的 内 容 不 属于 计算 机 组 成 原理 课程 的 教学 范围 :但 缺少 这 部 分 知识 要 学 懂 计 算 机 
组 成 原理 课程 是 非常 困难 的 ,特别 是 涉及 计算 机 各 个 部 件 的 具体 组 成 和 运行 原理 的 实际 例 
子 , 完 成 各 项 硬件 实验 是 一 定 要 对 基本 元 器 件 有 基本 的 认识 和 理解 ,并 且 会 使 用 它们 构成 不 
同 规模 的 功能 部 件 , 才 可 以 学 习 到 有 实用 价值 的 知识 和 开展 硬件 实际 工作 的 能 力 。 


习题 与 思考 题 
1. 说 明 数字 逻辑 电路 与 半导体 材料 是 什么 关系 。 


2. 夯 出 二 极 管 、 双 极 型 三 极 管 和 MOS 型 三 极 管理 想 状 态 时 的 等 效 开 关 和 相应 电路 。 
3. 图 2.38 为 4X4 的 MOS 只 读 存 储 器 ,X 为 字 线 (输入 ),O 为 位 线 (输出 ), 试 分 析 当 
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Xs 字 线 为 1 时 输出 O 对 应 的 十 进 制 数 据 。 



































0 
OO 0 0; 
图 2.38 MOS 只 读 存储 器 


4. 指出 下 列 已 .Fs 、Fs 和 FF 各 逻辑 表达 式 中 与 项 的 个 数 和 变量 的 个 数 。 

Fi=AB+AC+BC 

Fs=AB+ABC 

Fs=AB+AB+C 

F,=1 

5. 证 明 AB 十 AC 十 BC=AB+AC。 

6. 运用 AB 十 AC=AB 十 AC 十 BC, 进 行 配 项 ,证 明 

AD+BD+AB+BD+AC+ACEF+BEF+ DEFG = A+C+BD+ BEF 

7. 只 使 用 与 或. 非 门 电路 就 可 以 设计 出 任何 复杂 功能 的 组 合 逻辑 .时序 逻辑 电路 的 说 
法 正确 吗 ? 为什么? 

8. 时 序 逻 辑 电 路 和 组 合 逻 辑 电 路 的 差异 表现 在 哪些 方面 7 造成 这 种 差异 的 原因 是 
什么 ? 

9. CPLD 器 件 和 FPGA 器 件 在 内 部 组 成 和 使 用 方法 等 方面 有 什么 区 别 ? 

10. 出 于 什么 目的 要 在 本 教材 中 加 入 本 章 的 内 容 ? 











9 草 
数据 表示 .运算 算法 和 线路 实现 


运算 器 最 重要 的 功能 是 加 工 数据 ,为 此 必须 很 好 地 掌握 各 种 基本 类 型 的 数据 及 其 在 计 
算 机 内 的 表示 和 存储 方式 ,以 及 完成 运算 所 用 的 算法 和 实现 这 些 算法 所 用 的 原理 性 电路 。 
这 些 内 容 又 以 数字 化 信息 编码 ,布尔 代数 .数字 电路 与 逮 辑 设计 为 基础 。 布 尔 代 数 、 数 字 电 
路 与 数字 逻辑 设计 在 本 教材 第 2 章 进 行 了 简要 介绍 。 因 此 ,本 章 将 从 数字 化 信息 编码 讲 起 ， 
引出 二 进 制 编码 , 数 制 转换 ,插入 部 分 检 错 纠 错 码 知识 ; 接 下 来 介绍 各 种 基本 类 型 数据 的 表 
示 :; 数 值 数 据 算术 运算 的 有 关 方 法 。 

二 进 制 编码 , 数 制 转换 ,定点 小 数 和 整数 的 原 码 、 反 码 、 补 码 表示 是 本 章 的 核心 重点 
内 容 。 
检 错 纠 错 码 概念 , 讲 到 的 两 种 常用 的 检 错 、 纠 错 码 的 实现 原理 应 较 好 理解 ,而 对 它们 所 
用 的 具体 线路 简单 了 解 即 可 。 

应 该 掌握 定点 小 数 、 整 数 、 浮 点 数 在 计算 机 内 的 表示 , 补 码 加 减法 的 运算 规则 , 原 码 一 位 
乘除 法 的 原理 性 算法 和 完成 算术 运算 用 到 的 原理 性 逻辑 线路 。 补 码 乘 除法 ,加 速 乘 除 运算 
的 可 行 方案 简单 了 解 即 可 。 

本 章 作业 较 多 ,对 深入 理解 所 学 知识 和 比较 熟练 地 完成 必要 的 计算 很 有 必要 ,也 是 更 好 
地 学 习 运算 器 知识 的 基础 ,应 认真 完成 。 


3.1 数字 化 信息 编码 的 概念 和 二 进 制 编码 知识 


3.1.1 数字 化 信息 编码 的 概念 


计算 机 最 重要 的 功能 是 处 理 信息 ,如 数值 .文字 、 符 号. 语音、 图形 和 图 像 等 。 在 计算 机 
内 部 ,各 种 信息 都 必须 采用 数字 化 的 形式 被 保存 、 加 工 与 传送 。 掌 握 信 息 编码 的 概念 和 技术 
是 至 关 重 要 的 。 

所 谓 编码 ,就 是 用 少量 、 简 单 的 基本 符号 ,选用 一 定 的 组 合 规则 ,以 表示 大 量 复 杂 多 样 的 
信息 。 基 本 符号 的 种 类 和 这 些 符号 的 组 合 规则 构成 编码 的 两 大 要 素 。 例 如 ,用 10 个 阿拉 伯 
数字 表示 数值 ,用 26 个 英文 字母 构成 英文 词汇 ,就 是 现实 生活 中 编码 的 典型 例子 。 

当 要 使 用 的 基本 符号 数量 较 多 时 ,往往 还 要 采取 措施 ,以 便 首 先 使 用 更 少量 的 简单 符号 
来 编码 以 表示 那些 量 大 而 复杂 的 基本 符号 .再 用 这 些 基本 符号 来 表示 信息 ,这 就 构成 了 多 重 
编码 。 多 重 编码 的 典型 例子 是 汉字 编码 , 若 把 上 万 个 汉字 都 作为 基本 符号 就 太 多 了 ,可 以 首 
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先 用 笔 形 字画 、 偏 旁 部 首 ,拼音 或 其 他 方式 对 其 进行 编码 ,以 解决 汉字 输入 问题 。 

在 计算 机 中 ,广泛 采用 的 是 仅 用 0 和 1 两 个 基本 符号 组 成 的 基 二 码 , 亦 称 为 二 进 制 码 。 
主要 有 以 下 3 个 方面 的 原因 。 

(1) 基 二 码 在 物理 上 最 容易 实现 , 即 容易 找到 具有 两 个 稳定 状态 且 能 方便 地 控制 状态 
转换 的 物理 器 件 ; 可 以 用 两 个 状态 分 别 表示 基本 符号 0 和 1。 

(2) 用 基 二 码 表示 的 二 进 制 数 ,其 编码 ,计数 和 算术 运算 规则 简单 ,容易 用 数字 电路 实 
现 , 为 提高 计算 机 的 运算 速度 和 降低 实现 成 本 奠定 了 基础 。 

(3) 基 二 码 的 两 个 基本 符号 0 和 1 能 方便 地 与 逻辑 命题 的 “ 否 ”" 和 “是 ”, 或 称 “ 假 "和 
“ 真 ” 相 对 应 ,为 计算 机 中 的 逻辑 运算 和 程序 中 的 逻辑 判断 提供 了 便利 条 件 。 

计算 机 中 的 各 种 类 型 的 数据 ,通常 都 是 用 二 进 制 编码 形式 来 表示 、 存 储 、 人 处 理 和 传送 的 。 


3.1.2 二 进 制 编码 和 码 制 转换 


1. 数 制 与 进位 计数 法 

在 采用 进位 计数 的 数字 系统 中 ,如 果 只 用 个 基本 符号 (例如 0,1,2,…,r 一 1) ,通过 排 
列 起 来 的 符号 串 表示 数值 , 则 称 其 为 基数 制 (Radix-r Number System), 被 称 为 该 数 制 
的 基 (Radix)。 假 定 用 x 十 k 个 自 左 向 右 排 列 的 符号 Di( 一 ki<m 一 1) 表 示 数 值 N, 即 

N = Dm1D»2*** D1DoD-1D-2*** Dr 3513 

式 中 的 D;( 一 ki 过 m 一 1) 为 该 数 制 采用 的 基本 符号 ,可 取 值 0.1,2,… ,7 一 1, 小 数 点 位 置 隐 
含 在 Do 与 D-: 位 之 间 , 则 Dn-1… Do 为 N 的 整数 部 分 ,D-1… D-: 为 N 的 小 数 部 分 。 

如 果 每 个 Di 的 单位 值 都 赋 以 固定 的 值 Wi, 则 称 W; 为 该 位 的 权 (Weight) ,此 时 的 数 制 
称 为 有 权 的 基数 制 (Weighted Radix-r Number System) 。 此 时 N 代表 的 实际 值 可 表示 为 


N= DxW C2) 
如 果 该 数 制 编码 还 符合 " 闫 进 位 ”的 规则 . 则 每 位 的 权 ( 简 称 位 权 ) 可 表示 为 
a 
汪 中 国 直 闫 亲 痢 的 站 上: 站 入 认 村， 吉 各 其 可 也 汪 为 
N= pxr (入 加 
式 中 的 符号 ; 和 
,一 是 这 个 数 制 的 基 ; 








t 表示 这 些 符 号 的 排列 次 序 , 即 位 序号 ; 

D; 一 一 是 位 序号 为 i 的 一 位 上 的 符号 ; 

ee 是 第 i 位 上 的 一 个 1 所 代表 的 值 (位 权 ); 

D; Xr 是 第 i 位 上 的 符号 所 代表 的 实际 值 ; 

了》 一 一 表示 对 mm 十 k 位 的 各 位 的 实际 值 执行 累加 求 和 ; 

N 一 一 代表 一 个 数值 。 

此 时 该 数 制 被 称 为 > 进位 数 制 (Positional Radix-r Number System) ,简称 x 进 制 。 下 
面 是 计算 机 中 常用 的 几 种 进位 数 制 : 

二 进 制 "一 2, 基 本 符号 0.1 








数据 表示 ,和 运 划算 法 和 线路 实现 





八进制 ”一 8, 基 本 符号 0,1,2.,3,4.5,6.7 
十 六 进 制 ”一 16, 基 本 符号 0,1,2,3,4,5,6,7,8,9,A,B,C,D,E,F 
其 中 A~ 下 分 别 表示 十 进 制 数 10,11,12,13,14,15 

十 进 制 * 一 10 ,基本 符号 0,1,2,3,4,5,6,7,8,9 

如 果 每 一 数位 都 具有 相同 的 基 , 即 采用 同样 的 基本 符号 集 来 表示 , 则 称 该 数 制 为 固定 基 
数 制 (Fixed Radix Number System) ,这 是 计算 机 内 普遍 采用 的 方案 。 在 个 别 应 用 中 ,也 允 
许 对 不 同 的 数位 或 位 段 选用 不 同 的 基 , 即 混合 采用 不 同 的 基本 符号 集 来 表示 , 则 该 数 制 被 称 
为 混合 基数 制 (Mixed Radix Number System ) 。 

2. 二 进 制 编码 和 二 进 制 数据 

二 进 制 编码 是 计算 机 内 使 用 最 多 的 码 制 。 它 只 使 用 两 个 基本 符号 0 和 1, 并 且 通 过 由 
这 两 个 符号 组 成 的 符号 串 来 表示 各 种 信息 (各 种 类 型 的 数据 )。 二 进 制 的 数值 类 型 的 数据 亦 
是 如 此 ,计算 其 所 代表 的 数值 的 运算 规则 是 


N= TDixz D; 的 取 值 为 0 或 1 (本 


例如 〈1101. 0101): 一 (13.3125)io。 

等 号 左右 两 边 括号 内 的 数字 为 两 个 不 同 进 制 的 数字 ,括号 右 下 角 的 2 和 10 分 别 指明 左 
右 两 边 的 数字 为 二 进 制 和 十 进 制 的 数 。 按 式 (3.4) .计算 二 进 制 数 1101. 0101 的 实际 值 为 

1X23 十 1X22 十 0X2 十 1X2 十 0X2 十 1X2 环 十 0X2 十 1X2- 
8 十 4 十 1 十 0.25 十 0.0625 一 13. 3125 

从 式 中 可 以 进一步 看 到 ,由 于 二 进 制 只 用 0 和 1 两 个 符号 ,在 计算 二 进 制 位 串 所 代表 的 

实际 值 时 ,只 需 把 符号 为 1 的 那些 位 的 位 权 相 加 即 可 , 则 上 式 变 为 : 
2 十 2 十 2 十 2 十 2 二 113.3125 

熟练 地 记 清 二 进 制 数 每 位 上 的 位 权 是 有 益 的 。 当 位 序号 为 0 一 12 时 ,其 各 位 上 的 位 权 
分 别 为 1.2、4、8、16、32、64、128、256、512、1024、2048 和 4096。 

3. 数 制 转换 

计算 机 中 常用 几 种 不 同 的 进位 数 制 ,包括 二 进 制 \. 八 进 制 ,十进制 和 十 六 进 制 。 二 进 制 
数据 更 容易 用 人 逻辑 线路 处 理 ,更 接近 计算 机 硬件 能 直接 识别 和 处 理 的 数字 信息 的 使 用 要 求 ， 
而 使 用 计算 机 的 人 更 容易 接受 十 进 制 的 数据 类 型 。 二 者 之 间 的 进 制 转换 是 经 常 遇 到 的 
问题 。 

1) 十 进 制 数据 与 其 他 进 制 数 据 的 转换 

式 (3.3) 确 定 的 运算 规则 ,是 不 同 进 位 计数 制 数据 之 间 完 成 进位 制 转换 的 依据 。 

十 进 制 到 二 进 制 的 转换 ,通常 要 区 分 数 的 整数 部 分 和 小 数 部 分 ,并 分 别 按 除 2 取 余 数 部 
分 和 乘 2 取 整 数 部 分 两 种 不 同 的 方法 来 完成 。 

(1) 对 整数 部 分 .要 用 除 2 取 余数 办 法 完成 十 进 制 到 二 进 制 的 转换 ,其 规则 是 : 

@ 用 2 除 十 进 制 数 的 整数 部 分 , 取 其 余数 为 转换 后 的 二 进 制 数 整数 部 分 的 低位 数字 ; 

@ 再 用 2 去除 所 得 的 商 . 取 其 余数 为 转换 后 的 二 进 制 数 高 一 位 的 数字 ; 

@ 重复 执行 第 四 步 的 操作 ,直到 商 为 0. 结束 转换 过 程 。 

例如 ,将 十 进 制 的 37 转换 成 二 进 制 整数 的 过 程 如 下 : 
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到 | 37 ------- 1 低位 
2 IE 0 
2 9 ------- 1 
有 和 0 











高 位 
0 余数 部 分 ， 即 转换 后 的 结果 为 (100101) > 
(2) 对 小 数 部 分 ,要 用 乘 2 取 整 数 办 法 完成 十 进 制 到 二 进 制 的 转换 ,其 规则 是 : 
Q@ 用 2 乘 十 进 制 数 的 小 数 部 分 , 取 乘 积 的 整数 为 转换 后 的 二 进 制 数 的 最 高 位 数字 ; 
@ 再 用 2 乘 上 一 步 乘积 的 小 数 部 分 , 取 新 乘积 的 整数 为 转换 后 二 进 制 小 数 的 低 一 位 数字 ; 
@ 重复 第 四 步 操作 ,直至 乘积 部 分 为 0, 或 已 得 到 的 小 数位 数 满足 要 求 ,结束 转换 过 程 。 
例如 ,将 十 进 制 的 0. 43 ,转换 成 二 进 制 小 数 的 过 程 如 下 (假设 要 求 小 数 点 后 取 5 位 ): 
0.43X2 
0 0.86x2 
1 0.72x2 
1 
0 





高 位 


0.44X2 
0.88X2 
低位 1 0.76 
整数 部 分 , 即 转换 后 的 二 进 制 小 数 为 (0.01101)> 


对 小 数 进 行 转换 的 过 程 中 ,转换 后 的 二 进 制 已 达到 要 求 位 数 ,而 最 后 一 次 的 乘积 的 小 数 
部 分 不 为 0, 会 使 转换 结果 存在 误差 ,其 误差 值 小 于 求 得 的 最 低 一 位 的 位 权 。 

对 既 有 整数 部 分 又 有 小 数 部 分 的 十 进 制 数 ,可 以 先 转换 其 整数 部 分 为 二 进 制 数 的 整数 
部 分 ,再 转换 其 小 数 部 分 为 二 进 制 的 小 数 部 分 ,通过 把 得 到 的 两 部 分 结果 合并 起 来 得 到 转换 
后 的 最 终结 果 。 例 如 ,(37. 43)io 一 (100101. 01101)，。 

在 实现 手工 转换 时 ,如 果 对 二 进 制 数 已 经 比较 熟悉 ,基本 上 记 住 了 以 2 为 底 的 指数 值 ， 
即 二 进 制 数 每 一 位 上 的 权 , 对 十 进 制 数 进 行 转 换 时 ,也 可 以 不 采用 上 述 规则 ,基本 上 可 以 直 
接 写 出 来 。 例 如 ， 

(45. 625)io 一 32 十 8 十 4 十 1 十 0. 5 十 0. 125 

一 (101 101. 10 1):, 即 (101101.101);。 
(1105)io 一 1024 十 81 王 1024 十 64 十 16 十 1 
一 (10001010001)。. 即 (10001010001)，。 
参照 上 述 方法 ,也 可 以 实现 十 进 制 到 八进制 .十进制 到 十 六 进 制 的 转换 过 程 。 例 如 : 
(1) 完成 八进制 和 十 进 制 数 据 之 间 的 转换 .具体 如 下 。 

















8| 1109 ----5 
8[ 138 ----2 
8s[ 17 ----1 
8 2 -2 
0 结果 : (1109)10=(2125)g 
0.385x8 
3 0.08x8 
0 0.64x8 


5 心 i2 结果 : (0.385)io=(0.30S)s 
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(2) 完成 十 进 制 到 十 六 进 制 数 的 转换 方法 与 前 述 方法 类 似 , 只 是 乘除 16 时 ,手工 运算 
不 大 方便 。 

2) 二 进 制 与 八进制 .十 六 进 制 间 的 转换 

用 二 进 制 表示 一 个 数值 N, 所 用 的 位 数 为 log:N, 如 表示 4096, 开 为 13, 写 起 来 位 串 
较 长 。 为 此 ,计算 机 中 也 常常 采用 八进制 和 十 六 进 制 来 表示 数值 数据 ,为 表示 数值 N ,分 别 
有 如 下 对 应 关系 : 


ml 


N= >)D; X8' ”D; 的 取 值 为 0 到 7 《3.5》 


ee 











例如 (7.44)s= 二 7X8" 二 4X8 ! 十 4X8 “二 (7.5625)w。 


N= Tp; x 16 D; 的 取 值 为 0 到 9 和 A 到 下 (3.6) 
i=—k 


例如 (1A.08)1s 二 1X16! 十 10X16" 十 8X16“? 二 (26. 03125)1o。 

上 述 二 式 中 所 用 符号 的 意义 与 式 (3. 3) 中 所 用 符号 的 意义 类 同 , 但 此 处 Di 包含 的 基本 
符号 分 别 限于 0~7 和 0~9、A~F, 各 位 的 码 权 分 别 为 8 和 16。 

把 用 二 进 制 .八进制 ,十 六 进 制 表示 的 数 转 换 成 十 进 制 数 的 值 ,使 人 能 更 容易 地 衡量 这 
个 数值 的 大 小 。 

由 于 logz8 二 3,logz16 二 4, 即 1 位 八进制 的 数 可 以 用 3 位 二 进 制 的 数 重 编码 来 得 到 ,1 
位 十 六 进 制 的 数 可 以 用 4 位 二 进 制 的 数 重 编码 得 到 ,故人 们 通常 认为 ,在 计算 机 这 个 领域 
内 ,八进制 和 十 六 进 制 数 只 是 二 进 制 数 的 一 种 特定 的 表示 形式 。 表 3. 1 给 出 了 少量 二 进 制 、 
八进制 .十 六 进 制 和 十 进 制 数 的 对 应 关系 。 

表 3.1 二 进 制 .八进制 .十 六 进 制 和 十 进 制 的 对 应 关系 


















































二 进 制 数 八进制 数 十 六 进 制 数 十 进 制 数 的 值 
0000 00 0 0 
0001 01 1 1 
0010 02 2 2 
0011 03 3 3 
0100 04 4 4 
0101 05 5 5 
0110 06 6 6 
0111 07 7 7 
1000 10 8 8 
1001 11 9 9 
1010 12 A 10 
1011 13 B 11 
1100 14 C 12 
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续 表 
二 进 制 数 八进制 数 十 六 进 制 数 十 进 制 数 的 值 
1101 15 D 13 
1110 16 E 14 
Le 到 F 15 











在 把 二 进 制 数 转换 成 八进制 或 十 六 进 制 表示 时 ,应 从 小 数 点 所 在 位 置 分 别 向 左 、 向 右 对 
每 3 位 或 每 4 位 二 进 制 位 进行 分 组 , 写 出 每 一 组 所 对 应 的 1 位 八进制 数 或 十 六 进 制 数 。 若 
小 数 点 左 侧 ( 即 整数 部 分 ) 的 位 数 不 是 3 或 4 的 整数 倍 , 可 以 按 在 数 的 最 左 侧 补 零 的 方法 理 
解 ; 对 小 数 点 右 侧 ( 即 小 数 部 分 ) ,应 按 在 数 的 最 右 侧 补 零 的 方法 处 理 , 否 则 容易 转换 错 。 对 
不 存在 小 数 部 分 的 二 进 制 数 (整数 ) ,应 从 最 低位 开始 向 左 把 每 3 位 划分 成 一 组 ,使 其 对 应 一 
个 八进制 位 ,或 把 每 4 位 划分 成 一 组 ,使 其 对 应 一 个 十 六 进 制 位 。 例 如 ,(10. 101)* 变 成 八 进 
制 时 ,应 把 它 理解 为 (010. 101)*, 是 (2.5)s, 即 八进制 的 2.5。 当 把 它 转 换 为 十 六 进 制 时 ,应 
首先 变 为 (0010. 1010)* ,是 (2. A)is, 即 十 六 进 制 的 2.A ,而 不 是 (2.5)is。 又 如 ， 
(1100111. 10101101): 王 (147.532)s 
(1100111. 10101101): 一 (67. AD) is 
八进制 和 十 六 进 制 之 间 的 转换 不 是 很 常用 ,二 者 经 过 二 进 制 的 中 间 结 果 进 行 转换 是 方 
便 的 。 
4. 二 进 制 数 的 运算 规则 
二 进 制 数 之 间 可 以 执行 算术 运算 和 逻辑 运算 ,其 规则 简单 ,容易 实现 。 
1) 加 法 运算 规则 


0+0=0 例如 : 1101 
0+1=1 +) 1001 
1+0=1 10110 


1+1=0 “(产生 进位 ) 
2) 减法 运算 规则 


! 
So 


例如 : 1101 
(产生 借 位 )”-) 0111 


0110 


I 
oo-—o 


于 生计 全 
J 二 


3) 乘法 运算 规则 
二 进 制 数 乘法 的 计算 方法 ,与 十 进 制 数 乘法 的 计算 方法 类 似 , 按 乘 数 每 一 位 的 值 计算 出 
部 分 积 , 对 全 部 部 分 积 求 累加 和 则 得 到 最 终 乘积 。 


例如 : 1101 
0x0=0 X1001 
1101 
0x1=0 00 
1X0=0 0000 
EA | 1101 


1110101 
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4) 除法 运算 规则 
二 进 制 数 除法 的 计算 与 十 进 制 数 除法 类 似 , 也 由 减法 、 逐 位 上 商 等 操作 分 步 完 成 。 
例如 : 


1101 

1001 /1110101 
1001 
1011 
1001 


1001 
1001 
0 
逻辑 运算 是 在 对 应 的 两 个 二 进 制 位 的 逻辑 值 之 间 进 行 的 ,与 相 邻 的 高 低位 的 值 均 无 关 ， 
即 不 存在 进位 、 借 位 等 问题 。 
5) 逻辑 或 运算 规则 (运算 符 为 V ) 





0V0=0 例如 : 
0V1=1 1100 
1V0=1 V 1010 
1V1=1 1110 
6) 逻辑 与 运算 规则 (运算 符 为 人 ) 
0A0=0 例如 : 
0A1=0 1100 
1A0=0 A 人 1010 
1A1=1 1000 
7) 逮 辑 非 运算 规则 (运算 符 为 ”) 
-0=1 
-1=0 


逻辑 非 实现 对 单个 逻辑 值 的 处 理 , 而 不 是 对 两 个 逻辑 值 的 运算 ,人 逻辑 非 又 被 称 为 逻辑 取 
反 操作 。 对 人 逻辑 数 1011 逐 位 进行 取 反 ,其 结果 为 0100。 
8) 逮 辑 异 或 运算 规则 (运算 符 为 W) 


0 Y 0=0 例如 : 

0 Y 1=1 1100 
1 VY 0=1 VY 1010 
1 Vv 1=0 0110 


与 或 非 操作 是 三 种 最 基本 的 逻辑 操作 ,用 它们 可 以 组 合 出 任何 逻辑 运算 功能 。 某 些 
情况 下 ,还 要 用 到 逻辑 异 或 操作 。 逮 辑 异 或 实现 的 是 按 位 加 功能 ,只 有 参与 异 或 操作 的 两 个 
逻辑 值 不 同时 (一 个 为 0, 另 一 个 为 1) ,结果 才 为 1, 和 或 操作 结果 的 差异 表现 在 : 或 操作 中 
1 或 1=1, 而 异 或 操作 则 是 1 异 或 1 一 0。 


3.1.3 检 错 纠 错 码 


1. 检 错 纠 错 的 有 关 概 念 和 实现 思路 
数据 在 计算 机 系统 内 加 工 、 存 取 和 传送 的 过 程 中 可 能 产生 错误 。 为 减少 和 避免 这 类 错 
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误 , 一 方面 是 精心 选择 各 种 电路 ,改进 生产 工艺 与 测试 手段 ,尽量 提高 计算 机 硬件 本 身 的 可 
靠 性 ; 另 一 方面 是 在 数据 编码 上 找 出 路 , 即 采用 带 有 某 种 特征 能 力 的 编码 方法 ,通过 少量 的 
附加 电路 ,使 之 能 发 现 某 些 错误 ,甚至 能 准确 地 确定 出 错位 置 ,进而 提供 自动 纠正 错误 的 
能 力 。 

数据 校 验 码 就 是 一 种 常用 的 带 有 发 现 某 些 错误 ,甚至 带 有 一 定 自动 改 错 能 力 的 数据 编 
码 方法 。 它 的 实现 原理 是 在 合法 的 数据 编码 之 间 , 加 进 一 些 不 允许 出 现 的 (非法 的 ?编码 ,使 
合法 数据 编码 出 现 某 些 错误 时 ,就 成 为 非法 编码 。 这 样 , 则 可 以 通过 检查 编码 的 合法 性 来 达 
到 发 现 错误 的 目的 。 合 理 地 设计 编码 规则 ,安排 合法 或 不 合法 的 编码 数量 ,就 可 以 得 到 发 现 
错误 的 能 力 ,甚至 达到 自动 改正 错误 的 目的 。 这 里 用 到 一 个 码 距 (最 小 码 距 ) 的 概念 。 码 距 
是 指 任意 两 个 合法 码 之 间 至 少 有 几 个 二 进 制 位 不 相同 , 仅 有 一 位 不 同 , 称 其 (最 小 码 距 ) 为 
1 ,例如 用 4 位 二 进 制 表 示 16 种 状态 , 则 16 种 编码 都 用 到 了 ,此 时 码 距 为 1。 就 是 说 ,任何 
一 个 编码 状态 的 4 位 码 中 的 一 位 或 几 位 出 错 ,都 会 变 成 另 一 个 合法 码 ,此 时 无 检 错 能 力 。 若 
用 4 个 二 进 制 位 表示 8 种 合法 状态 ,就 可 以 只 用 其 中 的 8 个 编码 来 表示 之 ,而 把 另 8 种 编码 
作为 非法 编码 ,此 时 可 能 使 合法 码 的 码 距 为 2。 一 般 说 来 ,合理 地 增 大 编码 的 码 距 , 就 能 提 
高 发 现 错误 的 能 力 , 但 表示 一 定数 量 的 合法 码 所 使 用 的 二 进 制 位 数 要 变 多 ,增加 了 电子 线路 
的 复杂 性 和 数据 存储 、 数 据 传送 的 数量 。 在 确定 与 使 用 数据 校 验 码 的 时 候 , 通 常 要 考虑 在 不 
过 多 增加 硬件 开销 的 情况 下 , 尽 可 能 地 发 现 较 多 的 错误 ,甚至 能 自动 改正 某 些 最 常 出 现 的 错 
误 。 常 用 的 数据 校 验 码 是 奇偶 校 验 码 , 汉 明 校 验 码 ,循环 宛 余 校 验 码 等 。 纠 错 编码 是 对 检 和 错 
编码 更 进一步 的 发 展 和 应 用 。 

计算 机 内 经 常 遇 到 的 错误 有 两 大 类 : 随机 错误 和 突 发 错误 。 前 者 指 孤 立 出 现 的 一 个 错 
误 , 后 者 指 连 续 产 生 的 一 批 (彼此 之 间 可 能 有 关联 ) 错 误 。 对 它们 处 理 的 难度 和 复杂 度 会 有 
很 大 不 同 , 在 我 们 的 课程 中 基本 不 涉及 对 突 发 错误 的 检查 与 纠正 问题 ,有 兴趣 者 请 自行 查阅 
有 关 资 料 。 纠 错 编 码 的 分 类 方案 如 图 3. 1 所 示 。 





纠 错 码 


人 __ 从 校 验 位 与 信息 位 的 形成 关系 区 分 

非 线 仔 码 | | 线性 码 是 否 用 线性 运算 来 形成 相关 核验 位 的 值 ， 
从 校 验 位 与 信息 位 的 约束 条 件 区 分 

站 是 否 只 用 本 组 信息 形成 本 组 校 验 位 的 值 。 
从 码 字 本 身 的 结构 特性 区 

帮 特 环 码 ] [ 循环 码 ] 一 得 字 是 员 科 仿 玫 和 位 竺 得， 


: 信息 位 和 校 验 位 的 排列 位 置 。 
非 系统 码 | | 系统 码 | 一 一 数据 位 在 前 、 校 验 位 跟随 其 后 。 


图 3.1 纠 错 码 的 分 类 



























































2. 3 种 常用 的 检 错 纠 错 码 

1) 奇偶 校 验 码 

奇偶 校 验 码 是 一 种 开销 最 小 ,能 发 现 数据 代码 中 一 位 出 错 情况 的 编码 ,常用 于 存储 
器 读 写 检 查 , 或 ASCII 字符、 其 他 类 型 信息 传送 过 程 中 的 出 错 检查 。 它 的 实现 原理 ,是 使 
原来 合法 编码 码 距 由 1 增加 到 2。 若 合法 编码 中 有 一 个 二 进 制 位 的 值 出 错 了 ,由 1 变 成 
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0, 或 由 0 变 成 1, 这 个 码 必 将 成 为 非法 编码 。 实 现 的 具体 方法 ,通常 是 为 一 个 字 节 补 充 一 
个 二 进 制 位 , 称 为 校 验 位 ,通过 设置 校 验 位 的 值 为 0 或 1 的 方式 ,使 字 节 自身 的 8 位 和 该 
校 验 位 含有 1 值 的 位 数 一 定 为 奇数 或 偶数 。 在 使 用 奇数 个 1 的 方案 进行 校 验 时 , 称 为 奇 
校 验 ,反之 则 称 为 偶 校 验 。 依 据 8 位 的 数据 位 中 为 1 值 的 个 数 确定 校 验 位 的 值 , 是 由 专 设 
的 线路 实现 的 ,通常 使 用 几 级 异 或 门 电路 产生 校 验 位 的 值 ,其 输入 是 数据 位 的 信号 或 异 
或 运算 的 中 间 结 果 , 最 后 的 输出 信号 是 校 验 位 的 值 。 例 如 , 当 要 把 一 个 字 节 的 值 写 进 主 
存 时 ,首先 用 此 电路 形成 校 验 位 的 值 ,然后 将 这 9 位 的 代码 作为 合法 数据 编码 写 进 主 存 。 
当下 一 次 读 出 这 一 代码 时 ,再 用 相应 线路 检测 读 出 9 位 码 的 合法 性 。 若 在 主 存 写 进 、 存 
储 或 读 出 的 过 程 中 , 某 一 个 二 进 制 位 上 出 现 错误 ,得 到 的 9 位 码 必 变 成 非法 编码 ,从 而 发 
现 一 定 是 哪 一 位 上 出 现 了 错误 。 这 种 方案 只 能 发 现 一 位 错 或 奇数 个 位 出 错 , 但 不 能 确定 
是 哪 一 位 错 , 也 不 能 发 现 偶数 个 位 出 错 。 考 虑 到 ,一 位 出 错 的 概率 比 多 位 同时 出 错 的 概 
率 高 得 多 ,该 方案 还 是 有 很 好 的 实用 价值 。 
下 面 给 出 对 几 个 字 节 值 的 奇偶 校 验 的 编码 结果 : 
数据 ，” 奇 校 验 的 编码 ” 偶 校 验 的 编码 
00000000 ”100000000 000000000 
01010100 ”001010100 101010100 
01111111 C001111111 101111111 
L111 L111111 011111111 
该 例子 中 , 码 字 的 最 高 一 位 为 校 验 位 ,其 余 低 八 位 为 数据 位 。 从 中 可 以 看 到 , 校 验 位 的 
值 取 0 还 是 1, 是 由 数据 位 中 1 的 个 数 .是 奇 校 验 还 是 偶 校 验方 案 共 同 决定 的 。 
2) 汉 明 校 验 码 
这 是 由 Richard Hamming 于 1950 年 提出 、 目 前 还 被 广泛 采用 的 一 种 很 有 效 的 校 验 方 
法 。 其 只 要 增加 少数 几 个 校 验 位 ,就 能 检测 出 两 位 同时 出 错 、 亦 能 检测 出 一 位 出 错 并 能 自动 
恢复 该 出 错位 的 正确 值 的 有 效 手段 ,后 者 被 称 为 自动 纠 错 。 它 的 实现 原理 ,是 在 k 个 数据 位 
之 外 加 上 7 个 校 验 位 ,从 而 形成 一 个 k 十 r 位 的 新 的 码 字 ,使 新 得 到 的 码 字 的 码 距 比较 均匀 
地 拉 大 。 若 把 数据 的 每 一 个 二 进 制 位 合理 地 分 配 在 几 个 不 同 的 偶 校 验 位 的 组 合 中 ,使 每 一 
个 数据 位 与 不 同 的 校 验 位 组 合 建立 准确 的 对 应 关系 , 则 当 某 一 位 出 错 后 ,就 会 引起 相关 的 几 
个 校 验 位 的 值 发 生变 化 ,这 不 但 可 以 发 现 出 错 ,还 能 指出 是 哪 一 位 出 错 ,为 进一步 自动 纠 错 
提供 了 依据 。 
假设 为 上 《个 数据 位 设置 个 校 验 位 , 则 校 验 位 能 表示 2" 个 状态 ,可 用 其 中 的 一 个 状态 指 
出 “没有 发 生 错 误 ”, 用 其 余 的 2" 一 1 个 状态 指出 有 错误 发 生 在 某 一 位 ,包括 个 数据 位 和 
个 校 验 位 ,因此 校 验 位 的 位 数 应 满足 如 下 关系 : 
2 三 4A 十 r 十 1 KS 
如 果 要 求 在 检 出 与 自动 校正 一 位 错 的 基础 上 .也 能 同时 发 现 两 位 错 ,此 时 应 该 在 前 一 种 
条 件 下 再 增加 一 位 校 验 位 , 称 为 总 校 验 位 ,专用 于 区 分 是 一 位 出 错 还 是 双 位 出 错 , 则 此 时 的 
校 验 位 的 位 数 + 和 数据 位 的 位 数 & 应 满足 下 述 关系 : 
2"1 宇 k 十 r (3.8) 
式 (3.8) 是 通过 用 一 1 替代 式 (3.7) 中 的 7 得 到 的 。 
按 上 述 不 等 式 , 可 计算 出 数据 位 & 与 校 验 位 7 的 对 应 关系 ,如 表 3.2 所 示 。 
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表 3.2 数值 位 k 和 校 验 位 r 的 对 应 关系 











& 值 最 小 的 + 值 & 值 最 小 的 ~ 值 
3 一 4 4 27 一 57 他 

5 一 11 5 58 一 120 8 
12 一 26 6 











设计 汉 明 码 编码 的 关键 技术 ,是 合理 地 把 每 个 数据 位 分 配 到 个 校 验 组 中 ,以 确保 能 发 
现 码 字 中 任何 一 位 出 错 ; 若 要 实现 纠 错 ,还 要 求 能 指出 是 哪 一 位 出 错 , 对 出 错位 求 反 则 得 到 
该 位 的 正确 值 。 例 如 , 当 数 据 位 为 3 位 (用 Ds D: Di 表示 ) 时 ,检验 位 应 为 4 位 (用 Ps Ps P， 
Pi 表示 )。 可 通过 表 3. 3 表示 的 关系 ,完成 把 每 个 数据 位 划分 在 形成 不 同 校 验 位 的 偶 校 验 
值 的 逻辑 表达 式 中 。 


表 3.3 校 验 位 与 数据 位 的 对 应 关系 






































D; D; D， Pp, Ps P, Pp 

i 1 1 1 1 攻 

1 L 0 0 1 0 0 

最 低 3 行 1 0 1 0 0 1 0 

0 l 1 0 0 0 1 

低 3 行 编码 6 5 3 0 4 2 E 
表 中 D; D; Di 为 3 位 数据 位 ,P,P P; Pi 为 4 位 校 验 位 ,其 中 低 3 位 中 的 每 一 个 校 验 
位 P; P; Pi 的 值 ,都 是 用 3 个 数据 位 中 不 同 的 几 位 通过 偶 校 验 运算 规则 计算 出 来 的 。 其 对 
应 关系 是 : 对 Pi(i 的 取 值 为 1 一 3) ,总 是 用 处 在 P; 取 值 为 1 的 行 中 的 、 用 1 标记 出 来 的 数据 


位 来 计算 出 该 已 的 值 。 最 高 一 个 校 验 位 P ,被 称 为 总 校 验 位 , 它 的 值 是 通过 对 全 部 3 个 数 
据 位 和 其 他 全 部 校 验 位 (不 含 P 本 身 ) 执 行 偶 校 验 计算 求 得 的 。 

在 Pi、P;、P;、P, 竖 列 相应 行 分 别 填 1, 在 该 4 列 的 低 3 横行 其 他 位 置 分 别 填 0, 在 最 项 
横行 的 每 个 尚 空 位 置 都 分 别 填 1。 若 只 看 低 3 横行 , 右 4 竖 列 的 3 个 位 的 组 合 值 分 别 为 十 
进 制 的 1.2.4.0, 则 分 配 Di D。 Ds 列 的 组 合 值 为 3 5 6, 保 证 低 3 横行 各 竖 列 的 编码 值 各 不 
相同 。 

计算 各 校 验 位 的 值 的 过 程 叫 作 编码 , 按 刚 说 明 的 规则 ,4 个 校 验 位 所 用 的 编码 方程 为 

P,=D;@D.@D@P@POP, 


P: = D: 中 D: 
P: = D: OD 
P= D: 中 D， 


由 多 个 数据 位 和 多 个 校 验 位 组 成 的 一 个 码 字 , 将 作为 一 个 数据 单位 处 理 ,例如 被 写 人 内 
存 或 被 传送 走 。 之 后 ,在 执行 内 存 读 操作 或 在 数据 接收 端 , 则 可 以 对 得 到 的 码 字 ,通过 偶 校 
验 来 检查 其 合法 性 ,通常 称 该 操作 过 程 为 译 码 ,所 用 的 译 码 方程 为 
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S$ 一 P 由 D: 中 D: 中 Di 中 P: 中 P 中 P, 
S$; = P; 中 D: 中 D: 
S$: = P: 四 D: OD 
S = P.®@D:@D: 

译 码 方程 和 编码 方程 的 对 应 关系 很 简单 。 译 码 方程 是 用 一 个 校 验 码 和 形成 这 个 校 验 码 
的 编码 方程 执行 异 或 ,实际 上 是 又 一 次 执行 偶 校 验 运算 。 通 过 检查 4 个 S 的 结果 ,可 以 实现 
检 错 纠 错 的 目的 。 实 际 情况 是 , 当 译 码 求 出 来 的 St、Ss 、S: .Si 的 结果 与 表 3. 3 中 的 哪 一 列 
的 值 相 同 ,就 说 明 是 哪 一 位 出 错 ;故人 们 又 称 表 3. 3 为 出 错 模式 表 。 若 出 错 的 是 数据 位 ,对 
其 求 反 则 实现 纠 错 ;车 出 错 的 是 校 验 位 则 不 必 理 坚 。 举 例如 下 。 

(1) 任何 一 位 ( 含 数据 位 、 校 验 位 ) 均 不 错 , 则 4 个 S 都 应 为 0 值 ( 思 考 为 什么 会 如 此 ) 。 

(2) 任何 单独 一 位 数据 位 出 错 ,4 个 S 中 会 有 3 个 为 1; 如 Ds 错 , 则 S, SS Si 
为 1110。 

(3) 若 单独 一 位 校 验 位 出 错 ,4 个 S 中 会 有 一 个 或 两 个 为 1; 如 Pi 错 ,S4 Ss S。 Si 为 
1001 ,如 Ps 错 ,S, S; S: Si 为 1000。 

(4) 任何 两 位 ( 含 数据 位 、 校 验 位 ) 同 时 出 错 ,S, 一 定 为 0, 而 另外 3 个 S 位 一 定 不 全 为 
0, 此 时 只 知道 是 两 位 同时 出 错 ,但 不 能 确定 是 哪 两 位 出 错 , 故 已 无 法 纠 错 。 如 D 和 Ps 出 
错 ,会 使 5S, S; S; Si 为 0001。 请 注意 ,Ss 的 作用 在 于 区 分 出 错 的 位 数 是 奇数 还 是 偶数 ,Ss 
为 1 是 奇数 个 位 出 错 ,为 0 是 无 错 或 者 偶数 个 位 出 错 。 这 不 仅 为 发 现 两 位 错 所 必需 ,也 是 为 
确保 能 发 现 并 改正 一 位 错 所 必需 的 。 若 不 设置 S,, 某 两 位 出 错 对 几 个 S 的 影响 与 单独 另 一 
位 出 错 可 能 是 一 样 的 (不 必 花 费 精力 推荐 ), 此 时 车 不 加 以 区 分 ,简单 地 按 一 位 出 错 自 动 完 成 
纠 错 处 理 反 而 会 越 纠 越 错 。 

3) 循环 宛 余 校 验 码 CRC 码 

二 进 制 信息 位 串 沿 一 条 信号 线 逐 位 地 在 部 件 之 间或 计算 机 之 间 传 送 称 为 串 行 传送 。 
CRCCCyclic Redundancy Check) 码 可 以 发 现 并 纠正 信息 串 行 读 写 ,存储 或 传送 过 程 中 出 现 
的 一 位 、 多 位 错误 。 因 此 ,在 外 存储 器 设备 读 写 和 计算 机 之 间 串 行 通信 的 场合 得 到 普遍 
应 用 。 

CRC 码 一 般 是 指 & 位 信息 码 之 后 拼接 ” 位 校 验 码 。 其 特点 是 一 个 合法 码 字 实现 首尾 
连接 的 循环 移 位 ,每 一 步 移 位 操作 得 到 的 都 是 合法 码 字 。 应 用 CRC 码 的 关键 是 如 何 从 A 位 
信息 位 简便 地 得 到 位 校 验 位 (编码 ) 的 值 ,以 及 如 何 判 断 k 十 r 位 的 码 字 是 否 正确 。 下 面 仅 
就 CRC 码 应 用 中 的 问题 做 简单 介绍 (有 关 的 理论 问题 请 参阅 有 关 书 籍 )。 

(1) 模 2 运算 是 指 以 按 位 模 2 相 加 为 基础 的 四 则 运算 ,运算 时 不 考虑 位 间 进 位 和 
借 位 。 

(2) CRC 码 编码 是 经 过 模 2 除 运算 来 完成 的 。 其 得 到 商 的 规则 是 : 当 被 除数 或 者 部 分 
余数 的 最 高 位 为 1 时 , 商 1; 为 0 时 , 商 0。 当 余数 的 位 数 小 于 除数 的 位 数 时 结束 运算 ,该 余 
数 即 为 校 验 位 的 值 。 实 现 这 种 运算 用 到 的 线路 很 简单 ,实现 左 移 的 移 位 寄存 器 (实现 串 行 输 
出 ) 加 上 与 除数 有 关 的 异 或 控制 门 即 可 完成 .关键 是 如 何 得 到 模 2 除 运 算 的 除数 ( 称 为 生成 
多 项 式 ) ,通常 可 去 查 数学 表 。 

(3) CRC 的 译 码 与 纠 错 ,在 数据 接收 端 ,用 约定 的 生成 多 项 式 去 除 收 到 的 循环 码 , 如 果 
码 字 无 误 则 余数 应 为 0, 如 有 某 一 位 出 错 , 则 余数 不 为 0, 且 不 同 数位 出 错 余数 会 不 同 , 余 数 
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与 出 错位 的 对 应 关系 是 不 变 的 ,只 与 码 制 和 生成 多 项 式 有 关 。 还 用 这 个 电路 ,再 经 过 几 步 循 
环 移 位 和 相关 操作 即 可 实现 纠 错 。 


3.2 数据 表示 


在 这 一 节 , 重 点 讲解 数据 表示 , 即 计算 机 内 最 常用 的 信息 编码 。 其 包括 逻辑 型 数据 表 
示 中西 文 字符 编码 表示 ,数值 型 数据 的 编码 表示 。 这 些 内 容 是 数字 计算 机 设计 与 应 用 的 基 
本 知识 之 一 ,要 求 能 熟练 掌握 并 运用 自如 。 


3.2.1 逻辑 类 型 数据 的 表示 


逻辑 数据 是 用 来 表示 二 值 逮 辑 中 的 “是 "与 “和 否 "或 称 " 真 "与 * 假 "两 个 状态 的 数据 。 很 容 
易 想 到 ,用 计算 机 中 的 基 2 码 的 两 个 状态 1 和 0 恰好 能 表示 逮 辑 数据 的 两 个 状态 。 例 如 用 
1 表示 真 , 则 0 表示 假 。 请 注意 ,这 里 的 1 和 0 没有 了 数值 有 无 或 大 小 的 概念 ,只 有 逻辑 上 
的 意义 。 在 计算 机 内 ,可 以 用 一 位 基 2 码 表示 逮 辑 数据 ,就 是 说 ,8 个 逻辑 数据 可 以 存放 在 1 
个 字 节 中 ,可 用 其 中 的 每 一 位 表示 一 个 逻辑 数据 。 

正确 地 建立 逻辑 数据 的 概念 是 十 分 重要 的 。 因 为 计算 机 内 部 的 所 有 数字 化 信息 ,不 
论 它们 是 数据 ,指令 或 控制 信号 ,都 是 用 基 2 码 表 示 的 ,其 存储 与 处 理 都 是 用 人 四 辑 线路 实 
现 的 。 可 以 说 ,逻辑 线路 是 计算 机 硬件 组 成 的 基石 ,而 逮 辑 线路 处 理 的 对 象 就 是 逻辑 型 
数据 ,通称 逻辑 变量 , 即 实现 输出 逻辑 变量 与 输入 逻辑 变量 之 间 一 定 的 逻辑 运算 关系 。 
这 些 内 容 在 本 教材 的 第 2 章 已 有 一 定 曾 述 。 计 算 机 组 成 原理 课程 的 相当 大 的 一 部 分 内 
容 , 涉 及 计算 机 各 功能 部 件 本 身 的 逻辑 功能 与 实现 ,以 及 计算 机 整 机 各 部 件 之 间 的 多 辑 
关系 与 连接 。 


3.2.2 字符 类 型 数据 的 表示 


字符 是 计算 机 中 使 用 最 多 的 信息 形式 之 一 ,是 人 与 计算 机 通信 、 交 互 作用 的 重要 媒介 。 
在 计算 机 中 ,要 为 每 个 字符 指定 一 个 确定 的 编码 ,作为 识别 与 使 用 这 些 字符 的 依据 。 这 些 编 
码 的 值 ,是 用 一 定位 数 的 基 2 码 的 两 个 基本 符号 1 和 0 进行 编码 给 出 的 。 

1. ASCII 码 和 EBCDIC 码 

使 用 得 最 多 的 .最 普遍 的 是 ASCII 字符 编码 , 即 American Standard Code for 
Information Interchange, 如 表 3.4 所 示 。 





表 3.4 ASCII 字符 编码 表 






































bebs bs 
000 001 010 011 100 101 110 111 
bs bz bi bo 
0000 NUL DLE SP 0 @ P Pp 
0001 SOH DC1 ! 和 A Q a q 
0010 STX DC2 芝 2 B R b x 
0011 ETX DC3 井 3 C S c S 
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续 表 
bsbsbs 
000 001 010 011 100 101 110 111 
babzbibo 
0100 EOT DC4 $ 4 D d t 
0101 ENQ NAK % 号 E U e u 
0110 ACK SYN 人 6 F V f v 
0111 BEL ETB 7 G Ww g w 
1000 BS CAN ( 8 H X h x 
1001 HT EM > 9 I 过 i y 
1010 LF SUB x J : j z 
ott VT ESC 十 K [ k { 
1100 FF FS bE 和 1 | 
1101 CR GS 3 = M 3 m } 
1110 SO RS > N ‘ m 
1111 SI US / ? O o DEL 


























从 表 中 可 以 看 到 : 每 个 字符 是 用 7 位 基 2 码 表示 的 ,其 排列 次 序 为 065s545302b10o ,在 表 
中 的 565s04 为 高 位 部 分 ,b352b1b6 为 低位 部 分 。 而 一 个 字符 在 计算 机 内 实际 上 用 8 位 表示 。 
正常 情况 下 ,最 高 一 位 5b 为 0。 在 需要 奇偶 校 验 时 ,这 一 位 可 用 于 存放 奇偶 校 验 位 的 值 ,此 
时 称 这 一 位 为 校 验 位 。 

ASCI 是 由 128 个 字符 组 成 的 字符 集 。 其 中 编码 值 0 一 31 不 对 应 任何 可 印刷 (或 称 有 
字形 ) 字 符 ,通常 称 它们 为 控制 字符 ,用 于 通信 中 的 通信 控制 或 对 计算 机 设备 的 功能 控制 。 
编码 值 为 32 的 是 空格 (或 间隔 ) 字 符 SP。 编 码 值 为 127 的 是 删除 控制 DEL 码 。 其 余 的 94 
个 字符 称 为 可 印刷 字符 .有 人 把 空格 也 计 和 人 可 印刷 字符 时 , 则 称 有 95 个 可 印刷 字符 。 请 注 
意 ,这 种 字符 编码 中 有 如 下 两 个 规律 。 

(1) 字符 0 一 9 这 10 个 数字 符 的 高 3 位 编码 为 011, 低 4 位 为 000 一 1001。 当 去 掉 高 3 
位 的 值 时 , 低 4 位 正好 是 二 进 制 形式 的 0 一 9。 这 上 既 满足 正常 的 排序 关系 ,又 有 利于 完成 
ASCII 码 与 二 进 制 码 数值 之 间 的 类 型 转换 。 

(2) 英文 字母 的 编码 值 满足 正常 的 字母 排序 关系 , 且 大 、 小 写 英文 字母 编码 的 对 应 关系 
相当 简便 ,差别 仅 表现 在 b; 一 位 的 值 为 0 或 1, 有 利于 大 、 小 写字 母 之 间 的 编码 变换 。 

另 有 一 种 字符 编码 主要 用 在 IBM 计算 机 中 的 EBCDIC 编码 (Extended Binary Coded 
Decimal Interchange Code) 。 它 采用 8 位 码 . 有 256 个 编码 状态 ,但 只 选用 其 中 一 部 分 。0 一 
9 这 10 个 数字 符 的 高 4 位 编码 为 1111, 低 4 位 仍 为 0000~1001。 大 、 小 写 英文 字母 的 编码 
同样 满足 正常 的 排序 要 求 ,而 且 有 简单 的 对 应 关系 , 即 同一 个 字母 的 大 、 小 写 的 编码 值 仅 最 
高 的 第 二 位 的 值 不 同 ,易于 判别 与 变换 。 
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2. 字符 串 的 表示 

随 着 计算 机 在 文字 处 理 与 信息 管理 中 的 广泛 应 用 ,字符 串 已 成 为 最 常用 的 数据 类 型 之 
一 。 许 多 计算 机 中 都 提供 字符 串 操 作 功 能 ,一 些 计算 机 还 给 出 读 写字 符 串 的 机 器 指令 。 

字符 串 是 指 连续 的 一 串 字符 。 通 常 方式 下 ,它们 占用 
































主 存 中 连续 的 多 个 字 节 ,每 个 字 节 存 一 个 字符 。 当 主 存 字 上 个 | | 全 
由 2 个 或 4 个 字 节 组 成 时 ,在 同一 个 主 存 字 中 , 既 有 按 从 低 | TEA SET 
位 字 节 向 高 位 字 节 的 顺序 存放 字符 串 内 容 的 ,也 有 按 从 高 [READ| |DAER 
位 字 节 向 低位 字 节 的 次 序 顺 序 存放 字符 串 内 容 的 。 这 两 [CC) ) 

种 存放 方式 都 是 常用 方式 ,不 同 的 计算 机 可 以 选用 其 中 任 加 © 


何 一 种 。 例 如 ,IF A>B THEN READ (C) 就 可 以 有 ”图 3.2 字符 串 的 两 种 存放 方式 
两 种 不 同 的 存放 方式 ,如 图 3. 2 所 示 。 

假定 每 个 主 存 字 由 4 个 字 节 组 成 ,图 3. 2(a) 是 按 从 高 位 字 节 向 低位 字符 的 次 序 存放 字 
符 串 ,图 3. 2(b) 按 从 低位 字 节 向 高 位 字 节 的 次 序 存放 字符 串 。 主 存 中 每 个 字 节 存 的 都 是 
相应 字符 的 ASCII 编码 值 。 例 如 对 图 3. 2(a) 来 说 ,每 个 字 节 分 别 存放 的 是 十 进 制 的 73、70、 
32.65、62.66、32.84.、72.、69、78、32.、82.、69.、65、68、40.67 和 41 和 32。 

3. 中 文 汉字 的 编码 

西 文字 符 是 一 种 拼音 文字 ,用 30 个 左右 的 字母 可 以 拼写 出 所 有 单词 ,再 加 上 一 些 数学 
符号 ,标点 符号 等 辅助 字符 ,就 可 以 构成 一 个 完整 的 西 文字 符 集 ,字符 总 数 不 超 过 256 个 ,所 
以 使 用 7 位 或 8 位 二 进 制 位 就 可 以 表示 。 我 国 是 个 多 民族 的 国家 ,使 用 包括 汉 、 蒙 、 藏 、. 朝 
鲜 \ 仅 、 苗 ,哈尼 ,维吾尔 等 近 60 种 民族 文字 ,其 中 用 得 最 多 且 最 广 的 是 汉字 。 汉 字 也 是 字 
符 , 但 有 其 特殊 性 ,汉字 是 表意 文字 ,汉字 的 数量 很 多 ,总 数 超过 6 万 个 。 一 个 字 就 是 一 个 方 
块 图 形 ,编码 就 要 复杂 一 些 ,也 给 汉字 在 计算 机 内 部 的 表示 、 汉 字 的 传输 与 交换 、 汉 字 的 输入 
与 输出 等 带 来 了 一 系列 问题 。 下 面 对 汉 字 的 编码 、 输 入、 存储 和 输出 编码 进行 介绍 。 

1) 汉字 内 码 

汉字 内 码 又 称 机 内 码 , 是 指 用 于 汉字 信息 的 存储 、 交 换 ,检索 等 操作 的 机 内 代码 ,一般 采 
用 2 个 字 节 表示 。 各 种 不 同 输入 法 输入 的 汉字 ,其 内 码 在 计算 机 中 是 相同 的 。 汉 字 内 码 等 
于 汉字 国标 码 加 上 8080H. 即 表示 汉字 的 两 个 字 节 信息 的 最 高 一 个 二 进 制 的 值 必定 为 1, 例 
如 * 中 ? 字 的 机 内 码 为 D6DOH .这 有 利于 在 文字 处 理 软 件 中 区 分 中 文字 符 和 西 文字 母 。 

计算 机 中 的 汉字 编码 都 是 通过 软件 定义 和 处 理 的 ,硬件 不 直接 提供 对 汉字 处 理 的 支持 。 

1981 年 ,我 国 制定 了 “中 华人 民 共 和 国 国家 标准 信息 交换 汉字 编码 ”, 代 号 为 GB 
2312 一 1980。 在 这 种 编码 的 字符 集中 ,一共 收录 了 7445 个 汉字 和 图 形 ,其 中 汉字 6763 个 、 
图 形 682 个 。 所 谓 区 位 码 , 是 将 上 述 国 家 标准 局 公布 的 6763 个 两 级 汉字 分 为 94 个 区 ,每 个 
区 分 94 位 ,一 个 汉字 所 在 的 区 号 和 位 号 简单 地 组 合 在 一 起 就 构成 了 这 个 汉字 的 区 位 码 , 其 
中 高 两 位 表示 区 号 , 低 两 位 表示 位 号 .都 采用 十 进 制 数 。 实 际 上 也 就 是 把 汉字 表示 成 二 维 数 
组 ,每 个 汉字 在 数组 中 的 下 标 就 是 区 位 码 。 区 位 码 可 以 唯一 地 确定 一 个 汉字 或 符号 。 例 如 
“中 *” 字 位 于 54 区 48 位 ,“ 中 *” 字 的 区 位 码 即 为 *5448”。 区 位 码 的 值 加 上 十 六 进 制 的 2020 成 
为 国标 码 。 

2000 年 公布 的 汉字 编码 的 国家 标准 是 GB 18030, 该 标准 收录 了 27484 个 汉字 。 编 码 
标准 采用 单字 节 、 双 字 节 (2B) 、 四 字 节 (4B)。GB 18030 是 简体 中 文字 符 集 GB 18030 一 2000 
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和 GB 18030 一 2005 的 代号 。GB 18030 一 2005 的 标准 名 称 是 “中 华人 民 共 和 国 国家 标准 GB 
18030 一 2005: 信息 技术 : 中 文 编码 字符 集 (Chinese National Standard GB 18030 一 2005; 
Chinese coded character set)”。GB 18030 一 2005 取代 GB2312、GB 1300、GBK、18030 一 
2000 和 Big5 标准 ,支持 Unicode 的 CJK 统一 汉字 , 共 收 录 70244 个 汉字 。GB 18030 编码 
在 码 位 空间 上 与 Unicode 标准 对 应 。 

2) 汉字 输入 码 

键盘 是 计算 机 系统 最 重要 的 输入 设备 ,用 于 西 文 这 种 小 字符 集 的 文字 输入 是 很 方便 的 。 
由 于 汉字 是 大 字符 集 , 若 设计 并 使 用 专门 的 汉字 输入 键盘 则 有 许多 困难 ,例如 键 数 太 多 、 查 
找 不 方便 成 本 过 高 等 。 经 济 又 便捷 的 输入 方式 还 是 选用 普通 的 键盘 ,采用 几 个 键 的 组 合 代 
表 一 个 汉字 ,这 就 需要 解决 汉字 的 输入 码 问题 。 

汉字 输入 码 也 称 外 码 , 是 为 了 将 汉字 输入 计算 机 而 编制 的 代码 ,是 代表 某 一 汉字 的 一 串 
键盘 符号 。 汉 字 输 入 码 的 种 类 有 很 多 ,主要 可 划分 为 以 下 几 种 。 

(1) 数字 编码 ,如 区 位 码 、 国 标 码 .电报 码 等 。 

(2) 拼音 编码 ,如 全 拼 码 、 双 拼 码 、 简 拼 码 等 。 

(3) 字形 编码 ,如 王 码 五 笔 . 郑 码 、 大 众 码 等 。 

(4) 音 形 编码 ,如 表 形 码 . 钱 码 .智能 ABC 等 。 

在 输入 汉字 的 过 程 中 ,输入 一 个 汉字 需要 项 击 的 键 的 次 数 、 用 到 的 规则 方便 程度 和 输 
入 的 速度 ,不 同 的 输入 码 方案 会 有 所 不 同 ,可 谓 各 有 长 短 , 不 同 的 人 也 会 有 自己 的 偏爱 。 

在 键盘 输入 法 之 外 ,还 有 手写 汉字 联机 识别 输入 和 印刷 汉字 扫描 输入 后 自动 识别 两 种 
方法 , 现 均 已 达到 实用 水 平 。 现 在 还 有 一 种 用 语音 输入 汉字 的 方法 ,虽然 简单 易 操作 ,但 离 
实用 阶段 尚 有 差距 。 

3) 汉字 字形 码 

汉字 字形 码 又 称 汉字 字模 码 , 是 对 汉字 字形 经 过 点 阵 数 字 化 后 形成 的 一 串 二 进 制 数 ,用 
于 汉字 的 显示 和 打印 。 每 个 汉字 的 点 阵 规模 可 以 有 所 不 同 , 通 常 有 以 下 几 种 类 型 。 

(1) 简易 型 汉字 : 16X16，32 字 节 /汉字 。 

(2) 普通 型 汉字 : 24X24, 72 字 节 /汉字 。 

(3) 提高 型 汉字 : 32X 32,128 字 节 /汉字 。 

将 所 有 汉字 的 字模 点 阵 代 码 按 内 码 顺 序 集中 起 来 ,构成 了 汉字 库 。 汉 字库 可 以 被 保存 
在 磁盘 ,固化 在 内 存 或 使 用 时 调 入 内 存 ,固化 在 打印 机 的 逻辑 电路 中 。 


3.2.3 多 媒体 信息 编码 


计算 机 能 对 图 画 、 声 音 、 音 乐 和 电影 等 信息 进行 各 种 处 理 , 如 支持 建筑 /机 械 等 图 纸 制 
作 、 图 像 扫 描 输 入 和 人 处理、 音乐 合成 .语音 识别 与 合成 .视频 会 议 等。 这 势必 涉及 如 何在 计算 
机 内 部 表示 相关 媒体 信息 的 问题 。 

1. 图 的 编码 

在 计算 机 中 ,图 可 以 分 成 图 像 (Image) 和 图 形 (Graphics) 两 种 类 型 。 通 常 可 以 用 矢量 图 
(Vector Graphics) 表 示 ,也 可 以 用 位 图 (Bitmap 或 Bitmapped Image) 表 示 。 

图 像 表 示 法 类 似 于 汉字 的 字模 点 阵 码 。 只 是 汉字 描述 的 仅仅 是 形状 ( 即 字模 ), 而 对 于 
图 像 除了 要 描述 的 形状 外 ,还 要 描述 其 颜色 或 灰 度 。 例 如 ,用 8 位 二 进 制 数 表示 一 个 像素 点 
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的 灰 度 ,用 3 个 字 节 分 别 表示 彩色 图 像 一 个 像素 点 的 3 个 彩色 分 量 (R、G、B) 的 强度 。 
图 形 表示 法 是 根据 画面 中 所 包含 的 内 容 , 分 别 用 几何 要 素 ( 如 点 、 线 、 面 , 体 ) 和 物体 表面 
的 材料 与 性 质 以 及 环境 的 光照 条 件 、 观 察 位 置 等 来 进行 描述 ,如 工程 图 纸 ` 地 图 等 可 采用 图 
形 表示 ,它们 易于 加 工 处 理 , 数 据 量 也 少 。 汉 字 字 形 的 轮廓 描述 方法 就 属于 图 形 表示 。 

2. 声音 的 编码 

计算 机 处 理 的 声音 可 以 分 为 如 下 3 种 : 第 1 种 是 语音 , 即 人 的 说 话 声 ;第 2 种 是 音乐 ， 
即 各 种 乐器 演奏 出 的 声音 ;第 3 种 是 效果 声 , 如 掌声 打雷、 爆炸 等 声音 。 在 计算 机 内 部 可 以 
用 波形 法 和 合成 法 两 种 方法 来 表示 声音 。 所 有 的 声音 都 可 用 波形 法 来 表示 ,但 更 多 用 于 语 
音 和 效果 声 , 对 于 音乐 声 , 则 用 合成 法 来 表示 更 好 一 些 。 

声音 可 以 用 一 种 连续 的 随时 间 变 化 的 声波 波形 来 表示 。 这 种 波形 反映 了 声音 在 空气 中 
的 振动 。 计 算 机 要 能 够 对 声音 进行 处 理 , 必 须 将 声波 波形 转换 成 二 进 制 表示 形式 ,这 个 转换 
过 程 称 为 声音 的 "数字 化 编码 ”。 声 音 的 数字 化 编码 过 程 分 为 以 下 3 步 。 

(1) 以 固定 的 时 间 间 隔 对 声音 波形 进行 采样 ,使 连续 的 声音 波形 变 成 一 个 个 离散 的 采 
样 信号 ( 即 样本 值 ) ,每 秒 采样 的 次 数 被 称 为 采样 频率 ,通常 采用 44. 1kHz、22. 05kHz 和 
11.025kHz 这 3 种 频率 ,也 可 以 自行 选择 。 采 样 频率 越 高 ,声音 的 保 真 度 越 好 。 

(2) 对 得 到 的 每 个 样本 值 进行 模 数 转 换 ( 称 为 A/D 转换 ) ,将 每 个 样本 值 用 一 个 二 进 制 
数字 量 来 表示 。 这 个 过 程 即 所 谓 的 量化 处 理 。 转 换 后 的 二 进 制 数 的 位 数 一 般 可 以 有 两 种 选 
择 : 16 位 或 8 位 。 位 数 越 多 ,量化 精度 越 高 ,噪声 越 小 ,声音 质量 也 就 越 好 。 

(3) 对 产生 的 二 进 制 数据 进行 编码 (有 时 还 需 进 行 数 据 压 缩 ) ,以 按照 规定 的 统一 格式 
进行 表示 。 表 3. 5 是 波形 法 采用 的 几 种 不 同 参数 的 数字 化 声音 信息 的 比较 。 

表 3.5 波形 法 采用 的 几 种 不 同 参数 的 数字 化 声音 信息 的 比较 
几 种 不 同 参 数 的 数字 化 声音 信息 




















采样 频率 (kHz) 量化 精度 (bit) 每 分 钟 的 数据 量 (MB) 质量 与 应 用 
相当 于 激光 唱片 质量 ,用 于 最 高 
44.1 16 3 质量 要 求 的 场合 
Db6 16 2.65 相当 于 调频 广播 质量 ,可 用 作 伴 
8 站 32 音 和 声响 效果 
汪 16 2 相当 于 调幅 广播 质量 ,可 用 作 伴 
8 0.66 音 和 解说 词 











音 的 另 一 种 表示 方法 是 合成 法 。 它 主要 适用 于 音乐 在 计算 机 内 部 的 表示 。 它 把 音乐 
的 乐谱 、 弹 奏 的 乐器 类 型 . 击 键 力度 等 用 符号 进行 记录 。 目 前 广 为 采 用 的 一 种 标准 为 MIDI 
(Musical Instrument Digital Interface) 。 例 如 ,在 MIDI 标准 中 ,一 个 MIDI 文件 (扩展 名 为 
mid) 中 包含 了 一 连 串 的 MIDI 消息 。 每 个 MIDI 消息 由 若干 字 节 组 成 ,通常 第 一 个 字 节 为 
状态 字 节 ,其 后 为 1 个 或 2 个 数据 字 节 。 状 态 字 节 的 特征 是 最 高 位 为 1, 它 用 来 指出 紧 随 其 
后 的 数据 字 节 的 用 途 和 含义 。 数 据 字 节 的 最 高 位 为 0, 后面 是 MIDI 消息 的 信息 内 容 。 例 
如 ,表示 一 个 “中 央 C” 的 MIDI 消息 可 由 以 下 3 个 字 节 组 成 : 90h、3Ch、40h。 其 中 90 是 状 
态 字 节 , 它 表示 一 个 音符 的 开始 ;3C 表示 击 键 的 位 置 为 “中央 C”;40 表示 击 键 的 速度 为 中 
等 。 与 波形 表示 方法 相 比 ,采用 合成 法 的 MIDI 表示 .其 数据 量 要 少 得 多 (相差 2 一 3 个 数量 
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级 ) ,编辑 修改 也 比较 容易 。 但 它 主要 适用 于 表现 各 种 乐器 所 演奏 的 乐曲 ,不 能 用 来 表示 语 
音 等 其 他 声音 。 

为 了 处 理 上 述 两 类 数字 声音 信息 ,计算 机 内 部 有 一 个 相应 的 声音 处 理 硬件 (如 声卡 ) ,用 
来 完成 对 各 种 声音 输入 设备 输入 的 声音 进行 数字 化 编码 处 理 , 并 将 处 理 后 的 数字 波形 声音 
还 原 为 模拟 信号 声音 ,经 功率 放大 后 输出 。 有 的 声音 处 理 硬件 可 外 接 MIDI 键盘 ,将 弹 奏 的 
乐曲 以 MIDI 形式 输入 计算 机 内 ,并 将 计算 机 处 理 后 的 MIDI 乐曲 经 合成 器 ( 波 表 合成 器 或 
频率 合成 器 ) 合 成 为 音乐 声音 后 输出 。 

3. 视频 信息 的 编码 

视频 信息 的 信息 量 最 丰富 , 它 是 一 种 最 有 感染 力 的 承载 信息 媒体 。 视 频 信 息 的 处 理 是 
多 媒体 技术 的 核心 。 计 算 机 通过 在 内 部 安装 一 个 视频 获取 设备 (如 视频 卡 ) ,将 各 类 视频 源 
(如 电视 机 摄像机、VCD 机 或 放 像 机 等 ) 输 入 的 视频 信号 进行 相应 的 处 理 , 转 化 为 计算 机 内 
部 可 以 表示 的 二 进 制 数 字 信 息 。 

视频 获取 设备 将 视频 信号 转换 为 计算 机 内 部 表示 的 二 进 制 数字 信息 的 过 程 被 称 为 视频 
信息 的 “数字 化 ”。 视 频 信 息 的 数字 化 过 程 比 声音 更 复杂 一 些 , 它 是 以 一 幅 幅 彩色 画面 为 单 
位 进行 的 。 每 幅 彩色 画面 有 亮度 (Y) 和 色差 (U,V)3 个 分 量 , 对 Y .UV 这 3 个 分 量 需 分 别 
进行 采样 和 量化 ,得 到 一 幅 数字 图 像 。 表 3. 6 是 几 种 常用 数字 视频 的 格式 。 


表 3.6 几 种 常用 数字 视频 的 格式 











名 称 分 状 率 量化 精度 数据 量 
CCIR601 720X576X25 8 十 4 十 4 124Mb/s 
CIF 360X288X25 8 十 4 十 4 26Mb/s 
QCIF 180X144X25 8 十 4 十 4 6. 5Mb/s 











从 表 3.6 中 可 以 看 出 ,数字 视频 信息 的 数据 量 非常 大 。 例 如 ,一 分 钟 CCIR601 数字 视 
频 , 其 数据 量 约 为 1Gb. 这 样 大 的 数据 量 无 论 是 存储 、 传 输 还 是 处 理 , 都 相当 困难 。 要 解决 这 
个 问题 就 必须 对 数字 视频 信息 进行 压缩 编码 处 理 。 在 获取 数字 视频 的 同时 立即 进行 压缩 编 
码 的 处 理 , 称 为 实时 压缩 。 有 些 视频 获取 设备 具有 实时 压缩 的 功能 。 


3.2.4 数值 类 型 数据 的 表示 


数值 类 型 数据 是 表示 数量 多 少 .数值 大 小 的 数据 。 它 们 有 多 种 类 型 和 不 同 的 表示 方法 。 

日 常生 活 中 ,用 得 最 多 的 是 带 正 、 负 符号 的 十 进 制 数字 串 形式 的 表示 方法 ,例如 
3. 1416、 一 256 等 。 这 种 形式 的 数据 难以 在 计算 机 内 直接 存储 与 运算 ,主要 用 于 计算 机 的 输 
入 /输出 操作 ,是 人 -机 间 交 换 数据 的 媒介 。 

在 计算 机 内 有 时 可 以 使 用 二 -十 进 制 编码 , 即 用 4 位 基 2 码 编码 一 位 十 进 制 数 , 一 个 多 
位 的 十 进 制 数 被 表示 为 这 种 编码 的 数 串 。4 位 基 2 码 组 成 16 个 状态 ,一 位 十 进 制 数 仅 有 10 
个 状态 ,因此 ,怎样 从 16 个 状态 中 选用 其 中 10 个 就 有 非常 多 的 方案 。 下 面 还 会 详细 讨论 。 

在 计算 机 中 最 常用 的 方法 .是 用 二 进 制 码 表示 数据 ,包括 整数 、 纯 小 数 、 实 数 (通称 浮 点 
数 )。 这 有 利于 减少 所 用 存储 单元 的 数量 ,又 便于 实现 算术 运算 。 为 了 更 有 效 地 、 方 便 地 统 
一 表示 正 数 负数 和 零 , 对 二 进 制 数 又 可 以 选用 原 码 ` 反 码 ` 补 码 等 多 种 编码 方案 表示 。 
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数值 数据 的 表示 与 编码 方案 ,与 计算 机 的 设计 .实现 关系 十 分 密切 , 且 涉及 一 些 基 础 更 
论 与 处 理 技术 ,有 必要 进行 较为 详细 的 讨论 , 放 在 3.3 节 专门 讲解。 
数值 数据 用 于 表示 数量 的 大 小 。 讨 论 数值 数据 时 ,经 常用 到 数值 范围 和 数据 精度 两 个 
概念 。 数 值 范围 是 指 一 种 类 型 的 数据 所 能 表示 的 最 大 值 和 最 小 值 ; 数 据 精度 ,通常 用 实数 所 
能 给 出 的 有 效 数字 的 位 数 表示 。 这 两 个 概念 是 不 同 的 。 在 计算 机 中 ,它们 的 值 与 用 多 少 个 
二 进 制 位 表示 某 种 类 型 的 数据 ,以 及 怎么 对 这 些 位 进行 编码 有 关 。 
二 进 制 数 主要 分 成 定点 小 数 .整数 与 浮 点 数 3 类 ,还 有 用 4 位 二 进 制 表示 一 个 十 进 制 数 
位 的 压缩 数字 串 。 先 简要 说 明 这 3 类 二 进 制 数 的 一 般 表示 ,再 详细 讨论 其 具体 编码 形式 。 
1. 定点 小 数 的 表示 方法 
定点 小 数 是 指 小 数 点 准确 固定 在 数据 某 个 位 置 上 的 小 数 。 从 实用 角度 看 ,都 把 小 数 点 
固定 在 最 高 数据 位 的 左边 ,小 数 点 前 边 再 设 一 位 符号 位 。 按 此 规则 ,任何 一 个 小 数 都 可 以 被 
写成 
N= NsN-IN-:… 和-w 
如 果 在 计算 机 中 用 加 十 1 个 二 进 制 位 表示 上 述 小 数 , 则 可 以 用 最 高 (最 左 ) 一 个 二 进 制 
位 表示 符号 (如 用 0 表示 正 号 , 则 1 就 表示 负 号 ), 而 用 后 面 的 m 个 二 进 制 位 表示 该 小 数 的 
数值 。 小 数 点 不 用 明确 表示 出 来 ,因为 它 总 是 固定 在 符号 位 与 最 高 数值 位 之 间 , 已 成 定论 。 
定点 小 数 的 取 值 范围 很 小 ,对 用 mm 十 1 个 二 进 制 位 的 小 数 来 说 ,其 值 的 范围 为 
INI 
即 小 于 1 的 纯 小 数 ,这 对 用 户 算 题 是 十 分 不 方便 的 ,因为 在 算 题 前 ,必须 把 要 用 的 数 ,通过 合 
适 的 “比例 因子 ”化 成 绝对 值 小 于 1 的 小 数 ,并 保证 运算 的 中 间 和 最 终结 果 的 绝对 值 也 都 小 
于 1, 在 输出 真正 结果 时 ,还 要 把 计算 的 结果 按 相 应 比例 加 以 扩大 。 
定点 小 数 表示 法 主要 用 在 早期 的 计算 机 中 , 它 最 节省 硬件 。 随 着 计算 机 硬件 成 本 的 大 
幅度 降低 ,现代 的 通用 计算 机 都 被 设计 成 能 处 理 与 计算 多 种 类 型 数值 数据 的 计算 机 。 我 们 
主要 通过 定点 小 数 讨论 数值 数据 的 不 同 编码 方案 ,定点 小 数 也 被 用 来 表示 浮 点 数 的 尾数 
部 分 。 
2、 整数 的 表示 方法 
整数 表示 的 数据 的 最 小 单位 为 1 ,可 认为 它 是 小 数 点 定 在 数值 最 低位 右面 的 一 种 数据 。 
整数 又 被 分 为 带 符号 和 不 带 符号 的 两 类 。 对 带 符号 的 整数 来 说 ,符号 位 被 安排 在 最 高 
位 ,任何 一 个 带 符号 的 整数 都 可 以 被 写成 
和 N =NsNN-……NzNiNo 
对 于 用 "十 1 位 二 进 制 位 表示 的 带 符号 的 二 进 制 整数 ,其 值 的 范围 为 
IN 过 2 一 1 
对 不 带 符号 的 整数 来 说 ,所 有 的 十 1 个 二 进 制 位 均 被 用 于 数值 ,此 时 数值 的 范围 是 
0<N<2"n—1 
即 原 米 的 符号 位 被 解释 为 2" 的 数值 。 
有 时 也 用 不 带 符号 的 整数 表示 另外 一 些 内 容 ,此 时 它 不 再 被 理解 为 数值 的 大 小 ,而 被 看 
成 一 串 二 进 制 位 的 某 种 组 合 。 
在 很 多 计算 机 中 ,往往 同时 使 用 不 同位 数 的 几 种 整数 ,如 用 8 位 ( 称 为 字 节 )、16 位 ( 称 
为 半 字 ) .32 位 ( 称 为 字 ) 或 64 位 ( 称 为 双 字 ) 二 进 制 来 表示 一 个 整数 ,它们 占用 的 存储 空间 
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和 所 表示 的 数值 范围 是 不 同 的 。 
3. 浮 点 数 的 表示 方法 
浮 点 数 是 指 小 数 点 在 数据 中 的 位 置 可 以 左右 移动 的 数据 。 它 通常 被 表示 成 
N=MXR: 

这 里 的 M(Mantissa) 被 称 为 浮 点 数 的 尾数 ;R(Radix) 被 称 为 阶 码 的 基数 ;E(Exponent) 
被 称 为 阶 的 阶 码 。 计 算 机 中 一 般 规定 尺 为 2.8 或 16, 是 一 个 确定 的 常数 ,不 需要 在 浮 点 数 
中 明确 表示 出 来 。 因 此 ,要 表示 浮 点 数 , 一 是 要 给 出 尾数 M 的 值 ,通常 用 定点 小 数 形式 来 表 
示 。 它 决定 了 浮 点 数 的 表示 精度 , 即 可 以 给 出 的 有 效 数字 的 位 
数 。 二 是 要 给 出 阶 码 ,通常 用 整数 形式 表示 。 它 指出 的 是 小 数 
点 在 数据 中 的 位 置 ,决定 了 浮 点 数 的 表示 范围 。 浮 点 数 也 要 有 
符号 位 。 在 计算 机 中 , 浮 点 数 通 常 被 表示 成 如 图 3. 3 所 示 的 格式 。 

图 3. 3 中 M, 是 尾数 的 符号 位 , 即 浮 点 数 的 符号 位 ,安排 在 最 高 一 位 ;E 是 阶 码 , 紧 跟 在 
符号 位 之 后 ,占用 mm 位 , 含 阶 码 的 一 位 符号 ;M 是 尾数 ,在 低位 部 分 ,占用 位 。 

合理 地 选择 mr 和 的 值 是 十 分 重要 的 ,以 便 在 总 长 度 为 1 十 m 十 n 个 二 进 制 表示 的 浮 点 
数 中 , 既 保 证 有 足够 大 的 数值 范围 ,又 保证 有 所 要 求 的 数值 精度 。 例 如 ,在 PDP-11/70 计算 
机 中 ,用 32 位 表示 的 一 个 浮 点 数 , 符 号 位 占 1 位 , 阶 码 用 8 位 ,尾数 用 23 位 , 数 的 表示 范围 
约 为 土 1. 7X10*”, 精 度 约 为 十 进 制 的 7 位 有 效 数字 。 

若 不 对 浮 点 数 的 表示 格式 作出 明确 规定 ,同一 个 浮 点 数 的 表示 就 不 是 唯一 的 。 例 如 
0.5 也 可 以 表示 为 0.05X10: .50X10 等。 为 了 提高 数据 的 表示 精度 ,也 为 了 便于 浮 点 数 
之 间 的 运算 与 比较 ,规定 计算 机 内 浮 点 数 的 尾数 部 分 用 纯 小 数 形式 给 出 ,而 且 当 尾数 的 值 不 
为 0 时 ,其 绝对 值 应 大 于 或 等 于 0.5, 这 被 称 为 浮 点 数 的 规格 化 表示 。 对 不 符合 这 一 规定 的 
浮 点 数 ,要 通过 修改 阶 码 并 同时 左右 移 尾数 的 办 法 使 其 变 成 满足 这 一 要 求 的 表示 形式 ,这 种 
操作 被 称 为 浮 点 数 的 规格 化 处 理 , 对 浮 点 数 的 运算 结果 就 经 常 需要 进行 规格 化 处 理 。 

当 一 个 浮 点 数 的 尾数 为 0, 不论 它 的 阶 码 为 何 值 ,该 浮 点 数 的 值 都 为 0。 当 阶 码 的 值 为 
它 能 表示 的 最 小 一 个 值 或 更 小 的 值 时 ,不管 其 尾数 为 何 值 ,计算 机 都 把 该 浮 点 数 看 成 零 值 ， 
通常 称 其 为 机 器 零 , 此 时 该 浮 点 数 的 所 有 各 位 (包括 阶 码 位 和 尾数 位 ) 都 清 为 0 值 。 

按 国际 电子 电气 工程 师 协会 的 IEEE 标准 ,规定 常用 的 浮 点 数 的 格式 如 表 3.7 所 示 。 


表 3.7 IEEE 标准 的 浮 点 数 格 式 
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图 3.3 浮 点 数 的 格式 


























符号 位 阶 码 尾数 总 位 数 
短 浮 点 数 ( 单 精度 ) 1 8 23 32 
长 浮 点 数 ( 双 精 度 ) 1 11 52 64 
临时 浮 点 数 1 15 64 80 














对 短 浮 点 数 和 长 浮 点 数 , 当 其 尾数 不 为 0 值 时 ,其 最 高 一 位 必定 为 1, 在 将 这 样 的 浮 点 
数 写 入 内 存 或 磁盘 时 ,不 必 保存 该 位 ,可 左 移 一 位 尾数 隐藏 掉 它 ,这 种 处 理 技术 称 为 隐藏 位 
技术 。 目 的 是 用 同样 多 位 的 尾数 能 多 保存 一 个 二 进 制 位 。 为 了 保持 浮 点 数 的 值 不 变 , 还 要 
把 原来 的 阶 码 值 减 1。 在 将 浮 点 数 取 回 运算 器 执行 运算 时 ,再 恢复 该 隐藏 位 的 值 和 原来 的 
阶 码 值 。 对 临时 浮 点 数 (通常 只 出 现在 浮 点 运算 器 内 部 ), 不 使 用 隐藏 位 技术 。 
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从 上 述 讨论 可 以 看 到 , 浮 点 数 比 定点 小 数 和 整数 使 用 起 来 更 方便 。 例 如 ,可 以 用 浮 点 数 
直接 表示 电子 的 质量 9X10 “ 克 , 太 阳 的 质量 2X10” 克 .圆周率 3. 1416 等 。 上 述 值 都 无 法 
直接 用 定点 小 数 或 整数 表示 ,要 受 数值 范围 和 表示 格式 等 各 方面 的 限制 。 

4. 十 进 制 数 的 编码 与 运算 

十 进 制 数 的 每 一 个 数位 的 基 为 10, 但 到 了 计算 机 内 部 ,出 于 存储 与 计算 方便 的 目的 , 必 
须 采用 基 2 码 对 每 个 十 进 制 数位 进行 重 编码 ,所 需要 的 最 少 的 基 2 码 的 位 数 为 log:10, 取 整 
数 为 4。4 位 基 2 码 有 16 种 不 同 的 组 合 ,怎样 从 中 选择 出 10 个 组 合 来 表示 十 进 制 数位 的 
0 一 9, 有 非常 多 的 可 行 方 案 , 下 面 介绍 其 中 的 最 常用 的 几 种 。 

1) 十 进 制 有 权 码 

十 进 制 有 权 码 是 指 表示 一 个 十 进 制 数位 的 4 位 基 2 码 的 每 一 位 有 确定 的 位 权 。 

用 得 最 普遍 的 是 8421 码 , 即 4 个 基 2 码 位 的 权 从 高 向 低 分 别 为 8.4、2 和 1, 使 用 基 2 码 
的 0000、0001、…、1001 这 10 种 组 合 ,分 别 表示 0 一 9 这 10 个 值 。 这 种 编码 的 优点 是 这 4 位 
基 2 码 之 间 满 足 二 进 制 的 进位 规则 ,而 十 进 制 数位 之 间 则 是 十 进 制 规则 , 故 称 这 种 编码 为 以 
二 进 制 编码 的 十 进 制 (Binary Coded Decimal) 数 ,简称 BCD 码 或 二 -十 进 制 码 。 另 一 个 优点 
是 在 数字 符 的 ASCII 码 与 这 种 编码 之 间 的 转换 方便 , 即 取 每 个 数字 符 的 ASCII 码 的 低 4 位 
的 值 便 直 接 得 到 该 数字 的 BCD 码 , 入 /出 操作 简便 。 在 计算 机 内 实现 BCD 码 之 间 的 算术 运 
算 要 复杂 一 些 , 在 某 些 情况 下 .需要 对 加 法 运算 的 结果 进行 修正 。 修 正规 则 如 下 。 

(1) 若 两 个 8421 码 每 位 数 相 加 之 和 等 于 或 小 于 1001, 即 十 进 制 的 9, 不 需要 修正 。 例 
如 ,(1)w 十 (8)1o 二 (9)wo 的 计算 结果 本 身 就 是 正确 的 。 

(2) 若 相 加 之 和 在 10 到 15 之 间 , 一 方面 应 向 高 位 产生 一 进位 ,本 位 还 要 进行 加 6 修 
正 , 进 位 是 在 进行 加 6 修正 时 产生 的 。 例 如 ,(4)w 十 (9)w 二 (1)10(3)w 就 是 如 此 。 

(3) 若 相 加 之 和 在 16 和 18 之 间 时 ,向 高 位 的 进位 会 在 相 加 过 程 中 自己 产生 ,对 本 位 还 
需 进 行 加 6 修正 。 例 如 ,(7) 1 十 (9)1w 二 (1)10(6)1o 就 是 如 此 。 

另外 几 种 有 权 码 ,如 2421、5211、84-2-1、4311 码 ( 表 3. 8) ,也 都 是 用 4 位 有 权 基 2 码 表 
示 一 个 十 进 制 数位 ,但 这 4 位 基 2 码 之 间 并 不 符合 二 进 制 规则 。 这 几 种 有 权 码 的 特性 如 下 。 

(1) 当 采 用 2421、5211 和 4311 编码 时 ,任何 两 个 十 进 制 数 位 相 加 产生 10 或 大 于 10 的 
结果 ,相应 的 基 2 码 相 加 会 向 高 一 位 产生 进位 ,有 利于 实现 逢 十 进位 的 计数 和 加 法 规则 。 

(2) 任何 两 个 相 加 之 和 等 于 9 的 十 进 制 数位 的 基 2 码 , 互 为 反 码 , 即 满足 十 进 制 数 按 9 
互补 (9's Complement) 的 关系 ,有 利于 简化 减法 处 理 。 表 3. 8 给 出 的 是 上 面 提 到 的 十 进 制 
数位 的 编码 方案 。 


表 3.8 4 位 有 权 码 

















十 进 制 数 8421 码 2421 码 5211 码 84-2-1 码 4311 码 
0 0000 0000 0000 0000 0000 
1 0001 0001 0001 0111 0001 
区 0010 0010 0011 0110 0011 
3 0011 0011 0101 0101 0100 
4 0100 0100 0111 0100 1000 
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续 表 
十 进 制 数 8421 码 2421 码 5211 码 84-2-1 码 4311 码 
5 0101 1011 1000 1011 0111 
6 0110 1100 1010 1010 1011 
六 0111 1101 1100 1001 1100 
8 1000 1110 1110 1000 1110 
9 1001 1111 到 过 弄 JU 














2) 十 进 制 无 权 码 

十 进 制 无 权 码 是 指 表 示 一 个 十 进 制 数 位 的 4 位 基 2 码 的 每 一 位 没有 确定 的 位 权 。 

在 采用 的 无 权 码 的 一 些 方案 中 ,早期 用 得 比较 多 的 是 余 3 码 (Excess-3 Code) ,是 把 原 
二 进 制 的 每 个 代码 都 加 0011 值得 到 的 。 它 的 主要 优点 是 执行 十 进 制 数位 相 加 时 ,能 正确 地 
产生 进位 信和 号, 而且 还 给 减法 运算 带 来 了 方便 ,其 编码 结果 在 表 3.9 中 给 出 。 

格雷 码 是 另外 一 种 常用 的 二 -十 进 制 编码 ,是 使 任何 两 个 相 邻 的 代码 只 有 一 个 二 进 制 位 
的 状态 不 同 ,其 余 3 个 二 进 制 位 必须 有 相同 状态 。 这 种 编码 方法 的 好 处 是 ,从 一 编码 变 到 下 
一 个 相 邻 编码 时 ,只 有 一 位 的 状态 发 生变 化 ,有 利于 得 到 更 好 的 译 码 波 形 ,在 模拟 一 数字 、 数 
字 一 模拟 转换 的 电路 中 得 到 更 好 的 运行 结果 。 用 4 个 二 进 制 位 的 格雷 码 表示 十 进 制 数 的 
10 个 状态 的 方案 很 多 。 





表 3.9 4 位 无 权 码 
































十 进 制 数 余 三 码 格雷 码 (1) 格雷 码 (2) 
0 0011 0000 0000 
1 0100 0001 0100 
2 0101 0011 0110 
3 0110 0010 0010 
4 0111 0110 1010 
5 1000 1110 1011 
6 1001 1010 0011 
党 1010 1000 0001 
8 1011 1100 1001 
9 1100 0100 1000 











3) 数字 串 在 计算 机 内 的 表示 与 存储 

人 们 习惯 使 用 十 进 制 数 ,而 在 计算 机 内 ,采用 二 进 制 表示 和 处 理 数 据 更 方便 。 因 此 ,在 
计算 机 输入 和 输出 数据 时 ,要 进行 十 进 制 和 二 进 制 之 间 的 相互 转换 处 理 ,这 是 多 数 应 用 环境 
中 的 实际 情况 。 而 在 某 些 特定 的 应 用 领域 中 ,如 商业 统计 ,其 特点 是 运算 简单 而 数据 量 很 
大 ,这 样 使 输入 输出 过 程 中 的 进 制 转换 所 占 的 时 间 比 例 很 大 。 从 提高 机 器 的 运行 效率 考虑 ， 
也 可 以 采用 在 计算 机 内 部 直接 用 十 进 制 方式 表示 和 处 理 数 据 , 这 要 求 计 算 机 内 部 增加 少量 
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硬件 线路 。 目 前 ,大 多 数 通 用 性 较 强 的 计算 机 ,都 能 直接 处 理 十 进 制 形式 表示 的 数值 。 采 用 
十 进 制 表示 数据 的 另 一 个 目的 是 提高 数据 的 表示 范围 和 运算 精度 。 就 是 说 ,十 进 制 数 在 计 
算 机 内 是 以 十 进 制 的 数位 组 成 的 数 串 形式 存储 与 计算 的 ,其 位 数 , 即 串 长 是 可 变 的 ,可 规定 
最 长 可 用 位 数 ,因此 不 受 二 进 制 整数 和 浮 点 数 统一 格式 的 约束 。 

十 进 制 数 串 在 计算 机 内 主要 有 两 种 表示 形式 。 

(1) 字 符 串 形式 , 即 一 个 字 节 存放 一 个 十 进 制 的 数位 或 符号 位 的 字符 。 在 主 存 中 ,这 样 
的 一 个 十 进 制 数 占用 连续 的 多 个 字 节 . 故 为 了 指明 这 样 一 个 数 ,需要 给 出 该 数 在 主 存 中 的 起 
始 地 址 和 位 数 ( 串 的 长 度 ) 。 

对 用 这 种 方式 表示 的 数据 进行 算术 运算 是 很 不 方便 的 ,因为 每 个 数字 符 占 用 一 个 字 节 ， 
其 低 4 位 的 值 表示 数值 .而 高 4 位 的 值 在 进行 算术 运算 时 不 具有 数值 的 意义 。 因 此 ,用 这 种 
方式 表示 的 十 进 制 字 符 串 , 主 要 用 在 非 数 值 计算 的 有 关 应 用 领域 中 。 

(2) 压缩 的 十 进 制 数 串 形 式 , 即 一 个 字 节 存放 两 个 十 进 制 的 数位 , 它 比 前 一 种 形式 节省 
存储 空间 ,又 便于 直接 完成 十 进 制 数 的 算术 运算 ,是 广泛 采用 的 较为 理想 的 方法 。 

用 压缩 的 十 进 制 数 串 表 示 一 个 数 , 要 占用 主 存 连续 的 多 个 字 节 ,每 个 数位 占用 半 个 字 节 
( 即 4 个 二 进 制 位 ), 其 值 可 用 二 -十 进 制 编码 (BCD 码 , 数 字符 的 ASCII 码 的 低 4 位 ) 表 示 ， 
符号 位 也 占用 半 个 字 节 并 存放 在 最 低 数字 位 之 后 ,其 值 选用 4 位 编码 的 6 种 完 余 状态 中 的 
有 关 值 ,如 用 1100 表示 正 号 ,用 1101 表示 负 号 。 在 这 种 表示 中 ,规定 数值 位 加 符号 位 之 和 
必须 为 偶数 , 当 其 和 不 为 偶数 时 ,应 在 最 高 数字 位 之 前 补 一 个 0。 此 时 ,表示 一 个 数 要 占用 
该 偶数 值 位 的 一 半 那 么 多 个 字 节 。 例 如 ,十 123 被 表示 成 123C, 一 12 被 表示 成 012D。 

要 指明 一 个 压缩 的 十 进 制 数 串 , 也 需 给 出 它 在 主 存 中 的 首 地 址 和 数字 位 个 数 (不 含 符号 
位 ) ,又 称 位 长 ,位 长 为 0 的 数 其 值 为 0。 压 缩 的 十 进 制 数 串 表 示 方 法 的 优点 是 位 长 可 变 , 许 
多 机 器 中 规定 该 长 度 从 0 一 31,. 有 的 甚至 更 长 。 


3.3 二 进 制 数值 数据 的 编码 方案 与 运算 算法 


3.3.1 原 码 \ 反 码 、 补 码 的 定义 


二 进 制 数值 数据 包括 二 进 制 表 示 的 定点 小 数 、 整 数 和 浮 点 数 。 这 里 讲 的 编码 方法 ,主要 
是 如 何 能 方便 统一 地 表示 正 数 . 零 和 负数 .并 且 尽 可 能 地 有 利于 简化 对 它们 实现 算术 运算 用 
到 的 规则 。 很 容易 想到 ,数据 符号 的 正 与 负 , 可 用 一 位 二 进 制 的 0 和 1 两 个 状态 加 以 表示 。 
数据 的 数值 用 多 位 二 进 制 表示 。 最 常用 的 编码 方法 有 原 码 表示 、 补 码 表示 和 反 码 表示 3 种 。 
为 了 讨论 的 方便 ,通常 称 表示 一 个 数值 数据 的 机 内 编码 为 机 器 数 ,而 把 它 所 代表 的 实际 值 称 
为 机 器 数 的 真 值 。 

1. 定点 小 数 的 编码 方法 

用 定点 小 数 引出 数值 的 3 种 编码 ( 原 码 、 补 码 和 反 码 ) 方 案 是 最 方便 的 。 

1) 原 码 表示 法 

原 码 表示 法 是 用 机 器 数 的 最 高 一 位 代表 符号 ,以 下 各 位 给 出 数值 绝对 值 的 表示 方法 。 
其 定义 为 
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例如 ,X 一 十 0. 1011， [Xj 二 01011 
X=—0.1011, [Xjr=11011 

按 定义 ,当头 = 一 0. 1011 时 ,[X] 生 二 1 一 外 二 1. 0000 一 (一 0. 1011) 王 11011。 这 里 的 和 
为 数 的 实际 值 , 即 相应 机 器 数 的 真 值 .[X] 为 原 码 表示 的 机 器 数 。 

原 码 具 有 如 下 3 个 性 质 。 

(1) 在 原 码 表示 中 ,机 器 数 的 最 高 位 是 符号 位 ,0 代表 正 号 ,1 代表 负 号 ,以 下 各 位 是 数 
的 绝对 值 , 即 [X] 和 = 符号 位 十 | XX|。 

(2) 在 原 码 表示 中 , 零 有 两 种 表示 形式 , 即 

[十 0.0] = 00000， [一 0.0] = 10000 

设 XY 的 真 值 分 别 为 X 一 十 0. 0000,Y 一 一 0.0000。 对 正 的 0.0000, 按 原 码 定义 [LX] 原 一 
00000 ,对 一 0. 0000, 则 有 [YJ 和 二 1 一 了 ==1 十 0. 0000 王 10000, 因 此 零 的 原 码 有 两 种 表示 形式 。 

(3) 原 码 表示 方法 的 优点 是 在 数 的 真 值 和 它 的 原 码 表示 之 间 的 对 应 关系 简单 ,相互 转 
换 容易 ,用 原 码 实现 乘除 运算 的 规则 简单 。 缺 点 是 用 原 码 实 现 加 减 运算 很 不 方便 。 要 比较 
参与 加 减 运算 两 个 数 的 符号 ,要 比较 两 个 数 的 绝对 值 的 大 小 ,才能 确定 运算 结果 的 数值 和 符 
号 ,因此 在 计算 机 中 经 常用 后 面 介 绍 的 补 码 实现 加 减 运算 。 

2) 补 码 表示 法 

补 码 表示 法 是 用 机 器 数 的 最 高 一 位 代表 符号 ,以 下 各 位 给 出 数值 按 2 取 模 结果 的 表示 
方法 ,其 定义 为 














x 0 委 X<1 
[XJ# = (3. 10) 
2 二 X 一 1 和 X 坟 0 MOD 2 
例如 : 
X 一 十 0. 1011， [Xj]#=01011 
X 一 一 0. 1011， [X]# 王 10101 
按 补 码 的 定义 , 当 X 王 一 0.1011 时 ,[LX]# 一 2 十 X 一 10. 0000 十 (一 0. 1011) 王 10101。 
补 码 具 有 如 下 5 个 性 质 。 
(1) 在 补 码 表示 中 ,机 器 数 的 最 高 一 位 是 符号 位 ,0 代表 正 号 ,1 代表 负 号 。 机 器 数 和 它 
的 真 值 的 关系 是 [LXj# 二 2X 符 号 位 十 XX。 
(2) 在 补 码 表示 中 ,0 有 唯一 的 编码 , 即 [十 0.0]# 三 [一 0.0j# 二 00000。 
假定 X 王 十 0.0000,Y 一 一 0. 0000, 依 据 补 码 定义 , 则 有 
[XJ]#=X=00000,， [Y]# 一 2 十 Y 一 10. 0000 十 0. 0000 王 10. 0000 一 00000 
此 处 最 后 一 步 实 现 按 2 取 模 ,处 在 小 数 点 左 侧 第 二 位 上 的 1 去 掉 了 。 
(3) 补 码 表示 的 两 个 数 在 进行 加 法 运算 时 ,可 以 把 符号 位 与 数值 位 同等 处 理 ,只 要 结果 
不 超出 机 器 能 表示 的 数值 范围 ,运算 后 的 结果 按 2 取 模 后 ,得 到 的 新 结果 就 是 本 次 加 法 运算 
的 结果 , 即 机 器 数 的 符号 位 与 数值 位 都 是 正确 的 补 码 表示 , 即 
[X+Y]# 一 [X]# 十 [Y]# MOD 2 (3.11) 
这 一 结论 极为 重要 。 
例如 ,，X 一 十 0. 1010, Y 一 一 0. 0101, 则 [Xj# 二 01010, [Yj# 二 11011, 求 得 [Xj]## 十 
[YJ# 二 01010 十 11011 二 100101 , 按 2 取 模 后 ,符号 位 左边 一 位 上 的 1 去掉, 则 最 后 结果 为 
00101, 其 真 值 为 十 0. 0101。 符 号 位 与 数值 位 均 正确 。 
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又 如 ,Xi 一 X: 一 一 0.1000, 则 [Xi ]# 王 [X2:]# 王 11000, 那 么 LX 十 X]# 王 11000 十 11000 一 
110000, 按 2 取 模 后 得 10000, 它 的 真 值 为 一 1。 由 此 看 出 ,用 补 码 表示 定点 小 数 时 , 它 能 表 
示 一 1 的 值 。 

(4) [X]# 与 其 真 值 的 关系 。 假 定 L[X]# 一 XoXiX…Xo, 则 有 [X]# 一 2Xo 十 和 ,此 关系 
对 X 为 正 为 零 和 为 负 都 是 正确 的 。X 为 正 时 ,Xe 应 为 0,[X]i# 一 2X0 十 X 一 X,X 为 负 时 ， 
Xo 应 为 1,[X]# 一 2X1 十 X 一 2 十 X , 均 与 补 码 的 定义 吻合 。 由 此 又 可 以 得 到 从 [X]# 求 和 X 
的 关系 , 即 由 机 器 数 求 其 代表 的 真 值 的 关系 如 下 : 

X= [X]# 一 2Xo 
= XoXX2…X, 一 2Xo 
一 一 Xo 十 0. XiX2 《有 2 

当 X 为 正 数 时 ,Xo 王 0, 真 值 X 一 [X]#; 

当 X 为 负数 时 ,Xo 王 1, 真 值 X 王 一 1 十 0. XXX, 一 一 (1 一 0. XXX 。 

例如 [LX]# 王 10110, 则 X 的 真 值 王 一 (1 一 0.0110) 王 一 0. 1010。 当 已 知 数 的 补 码 需 计 
算数 的 真 值 时 可 采用 此 法 ,此 公式 在 推导 补 码 乘法 的 运算 算法 中 很 有 用 。 

(5) 补 码 数 的 算术 移 位 。 将 LX]# 的 符号 位 与 数值 位 一 起 右 移 一 位 并 保持 原 符 号 位 的 
值 不 变 , 可 实现 除法 功能 ( 除 以 2) , 即 LX/2]# 一 XoXoXiX…X,-iX,。 今 考虑 X 为 正 、 负 数 
两 种 情况 。 

设 X=0.0110,[X]# 王 00110, 右 移 一 位 得 00011, 是 X 除 以 2 的 补 码 结果 。 

设 X 王 一 0.0110,[X]# 王 11010 ,计算 [X/2]# 王 11101, 再 按 式 (3. 12) 求 真 值得 到 X/2 一 
一 0. 0011 ,说明 得 到 的 确实 是 X 除 以 2 的 结果 。 

为 了 得 到 一 个 数 的 补 码 表示 ,当然 可 以 通过 补 码 的 定义 求 得 ,但 更 简便 的 办 法 如 下 。 

@ 当 X=0 时 ,[LX]# 的 符号 位 取 0, 数 值 位 取 X 的 各 数值 位 上 的 值 , 此 时 有 [LX]# 一 
[Xj]m。 

@ 当 X<0 时,[LX]# 的 符号 位 取 1, 将 X 的 各 数值 位 取 反 (0 变 1.1 变 0) 再 在 最 低位 加 
1, 以 得 到 [X]# 的 各 数值 位 上 的 值 。 

从 [Xj] 求 [Xj# 时 ,对 正 数 或 零 , 有 [XX]# 二 [Xj]; 对 负数 ,是 符号 位 不 变 , 各 数值 位 变 
反 后 再 在 最 低位 执行 加 1 操作 。 同 理 ,由 [Xj# 求 [Xj 时 ,对 负数 仍 是 符号 位 不 变 , 各 数值 
位 变 反 后 再 在 最 低位 执行 加 1 操作 。 

在 说 明 补 码 的 性 质 (3) 时 ,特别 强调 两 个 数 的 补 码 相 加 , 仅 在 其 运算 结果 不 超出 机 器 能 
表示 的 数值 范围 时 .运算 结果 才 是 正确 的 ,否则 得 到 的 结果 不 正确 。 如 [XJ]# 十 [Yj 三 
01001 十 01010 王 10011. 两 个 大 于 0. 5 的 正 数 相 加 .结果 的 符号 位 变 成 负 号 ,数值 部 分 也 是 错 
误 的 。 这 是 因为 参加 运算 的 两 个 数 的 和 大 于 1. 超出 了 机 器 所 能 表示 的 范围 ,产生 了 所 谓 的 
“溢出 ”。 对 负数 也 会 产生 溢出 ,如 [Xj# 十 [YJ 二 10101 十 10100 二 01001, 两 个 负数 相 加 , 结 
果 的 符号 位 却 变 成 正 号 ,说明 结 果 是 错误 的 。 

为 了 方便 判别 结果 是 否 洲 出 , 某 些 机 器 采用 变形 补 码 , 又 称 模 4 补 码 表示 方法 ,其 定 
义 为 

天 (Ea 
[Xl# 一 | x 1<X<0 MOD 4 0 
也 就 是 常 说 的 双 符 号 位 的 补 码 表示 。 例 如 : 
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X 一 十 0.1011， [Xj#=001011 
X 一 一 0.1011， [Xj]#=110101 

按 模 4 补 码 定 义 , 当 X= 一 0. 1011 时 ,[X]# 一 4 十 X 一 100. 0000 十 (一 0. 1011) 
110101。 从 上 式 的 结果 可 以 看 出 , 模 4 补 码 的 表示 就 是 在 模 2 补 码 表 示 的 符号 位 之 前 再 增 
加 与 原 符号 同 值 的 另 一 个 符号 位 。 

模 4 补 码 具 有 如 下 2 个 性 质 。 

(1) 模 4 补 码 的 两 个 符号 位 相同 ,00 表示 正 号 .11 表示 负 号 ,其 数值 位 与 其 模 2 补 码 相 
同 。 当 符号 位 为 01 或 10 时 ,表示 数值 溢出 。01 表示 两 个 正 数 相 加 之 和 大 于 等 于 1 的 情 
况 , 通 称 数值 * 上 溢 ”; 为 10 时 ,表示 两 个 负数 相 加 ,而 其 和 小 于 一 1 的 情况 ,通称 数值 “下 
溢 ”。 最 左面 的 1 个 符号 位 总 是 正确 的 符号 位 的 值 。 

(2) 在 模 4 补 码 表示 中 , 零 有 唯一 的 编码 , 即 [ 十 0.0]# 二 [一 0.0]# 和 二 000000。 横 4 补 
码 能 表示 一 1, 即 为 110000, 与 模 2 补 码 的 情况 非常 类 似 。 

模 4 补 码 具 有 模 2 补 码 的 全 部 优点 ,而 且 更 容易 检查 加 减 运算 中 的 溢出 情况 。 有 必要 
指出 ,存储 每 个 模 4 的 补 码 数 时 ,只 要 存 一 个 符号 位 ,因为 任何 一 个 正确 的 数值 ,其 模 4 补 码 
的 两 个 符号 位 总 是 相同 的 。 只 在 把 两 个 模 4 补 码 的 数 送 往 算 术 与 逻辑 运算 部 件 ALU 完成 
加 减 计 算 时 , 才 把 每 个 数 的 符号 位 的 值 同时 送 到 ALU 的 两 位 符号 位 , 即 只 在 算术 与 逻辑 运 
算 部 件 中 采用 双 符 号 位 。 

3) 反 码 表示 法 

反 码 表示 法 是 用 机 器 数 的 最 高 一 位 代表 符号 .数值 位 是 对 负数 值 各 位 取 反 的 表示 方法 ， 
其 定义 为 











;4 OX 
[XjJa = 本 (3. 14) 
(2 一 2 ) 十 X 一 1 二 X 壕 0 MOD(2—2™) 
例如 : 
X= 十 0. 1011， [Xjx=01011 
X 一 一 0. 1011, [Xjs=10100 

正 数 的 反 码 与 其 原 码 、 补 码 相同 。 

反 码 具有 如 下 3 个 性 质 。 

(1) 在 反 码 表示 中 ,机 器 数 最 高 位 为 符号 位 ,0 代表 正 号 ,1 代表 负 号 。 

(2) 在 反 码 表示 中 , 零 有 两 个 编码 , 即 [十 0. 0 到 一 00000 ,[ 一 0.0]E 一 11111。 

(3) 用 反 码 进行 两 数 相 加 时 , 若 最 高 位 有 进位 ,还 必须 把 该 进位 值 加 到 结果 的 最 低位 ， 
才能 得 到 真正 的 结果 ,这 一 操作 通称 “循环 进位 ”。 

在 现在 的 计算 机 系统 中 , 反 码 较 少 被 使 用 。 

2. 整数 的 编码 方法 

与 定点 小 数 的 3 种 编码 方法 类 似 , 整 数 也 可 以 用 原 码 、 补 码 和 反 码 3 种 不 同 的 编码 方法 
表示 。 区 别 主要 表现 在 以 下 两 个 方面 。 

(1) 定点 小 数 的 小 数 点 位 置 严 格 地 设置 在 数 的 符号 位 与 最 高 数值 位 之 间 , 因 此 , 数 
的 表示 范围 和 编码 的 取 模 值 与 用 多 少 位 二 进 制 表示 一 个 数 无 关 , 该 位 数 只 影响 数值 的 
精度 。 

(2) 可 以 认为 整数 是 小 数 点 被 设置 在 最 低 一 位 数值 位 的 右边 ,机 器 数 的 最 高 位 仍 被 用 
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作 数 的 符号 位 。 数 值 的 表示 范围 ,以 及 整数 编码 的 取 模 值 ,都 与 表示 一 个 数 所 用 的 二 进 制 位 
数 有 关 。 
整数 3 种 编码 的 定义 、 特 性 和 相互 间 的 变换 方法 , 均 与 定点 小 数 相 应 的 3 种 表示 类 似 。 
只 是 补 码 的 取 模 值 为 2 或 2 (对 变形 补 码 ) ,这 里 的 & 为 二 进 制 整数 数值 位 的 位 数 。 
例如 : 
X=+10101 [XJ]r = [XJ]x = [XJs = 010101 
X = 一 10101 [Xj]x = 110101 
[X]# = 101011 
[XJs = 101010 
以 上 两 个 数 的 变形 补 码 分 别 为 0010101 和 1101011。 这 里 的 & 均 为 5。 
3. 浮 点 数 常用 的 编码 方法 
前 面 已 经 说 到 ,在 计算 机 内 , 浮 点 数 被 表示 为 如 图 3. 3 所 示 的 格式 。 
通常 情况 下 , 浮 点 数 的 符号 位 Ms 仍然 采用 0 表示 正 号 .1 表示 负 号 的 规则 。 数 的 尾数 
部 分 M 采用 定点 小 数 形式 表示 ,可 用 原 码 (或 补 码 ) 等 编码 方式 。 讨 论 浮 点 数 的 编码 方法 的 
关键 是 确定 对 阶 码 部 分 的 编码 方法 。 
在 多 数 通 用 计算 机 中 , 浮 点 数 的 阶 码 部 分 多 采用 整数 形式 的 移 码 表示 。 对 由 1 位 符号 
位 和 位 数值 位 组 成 的 二 进 制 形式 的 阶 码 , 其 移 码 的 定义 为 


[Xj# =2"+X 2 2 (9: 15% 
将 这 一 定义 与 整数 补 码 的 定义 相 比较 ,有 
X 0 
Doe = {a x 一 2 入 X 坟 0 MOD 2 人 


就 可 找 出 移 码 和 补 码 之 间 的 如 下 关系 : 

当 0 委 X<2" 时 ,[X]# 一 2" 十 X 一 2" 十 [LX]#; 

当 一 2"<X<0 时 ,[X]# 一 2" 十 X 一 (2 十 X) 一 2"。 

这 表明 ,由 [Xj]# 得 到 [Xj 的 方法 是 变 [LX]# 的 符号 为 其 反 码 。 例 如 : 

X 一 十 1011,[X]# 王 01011,[X]s 王 11011 
X 一 一 1011,[X]# 一 10101,[X]s 一 00101 

移 码 具 有 如 下 2 个 性 质 。 

(1) 最 高 一 位 为 符号 位 ,但 其 取 值 与 原 码 和 补 码 都 相反 ,1 代表 正 号 ,0 代表 负 号 。 

(2) 移 码 只 用 于 表示 浮 点 数 的 阶 码 , 故 只 用 于 整数 。 

对 移 码 一 般 只 执行 加 减 运算 ,在 对 两 个 浮 点 数 进行 乘除 运算 时 ,是 尾数 实现 乘除 运算 ， 
阶 码 执行 加 减 运算 。 对 移 码 执行 加 减 运算 时 ,需要 对 得 到 的 结果 加 以 修正 ,修正 量 为 2", 即 
要 对 用 移 码 求 得 的 符号 位 取 反 后 ,得 到 的 才 是 移 码 形式 的 正确 结果 。 

在 移 码 表示 中 ,0 有 唯一 的 编码 , 即 [十 0]# 一 [一 0]# 一 1000…0。 而 且 浮 点 数 机 器 零 的 
形式 为 000…000。 当 浮 点 数 的 阶 码 受 一 2" 时 ,不 管 尾数 值 大 小 如 何 , 都 属于 浮 点 数 下 洪 ,被 
认为 其 值 是 0。 此 时 , 移 码 表示 的 阶 码 值 正 好 是 每 一 位 都 为 0 的 形式 ,这 有 利于 简化 机 器 中 
的 判 0 线路 。 

到 了 IEEE 的 符 点 数 标准 754 中 ,对 上 述 内 容 做 了 某 些 补充 与 修正 , 见 本 教材 第 4. 3.1 
节 中 的 有 关 说 明 。 
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3.3.2 补 码 加 、 减 运算 规则 和 电路 实现 


在 计算 机 中 ,通常 总 是 用 补 码 完成 算术 的 加 减法 运算 。 其 规则 是 
[LX+Y]#=CXJ# 二 CY], CX—Y]#=[X]# 十 [一 YJ]# 

这 表明 ,有 了 补 码 表示 的 被 加 ( 减 ) 数 和 加 ( 减 ) 数 ,要 完成 计算 补 码 表示 的 二 数 之 和 或 二 
数 之 差 , 只 需 用 二 数 的 补 码 直 接 执 行 加 减 运算 即 可 ,符号 位 与 数值 位 同等 对 待 ,一 起 参加 运 
算 , 若 运算 结果 不 溢出 , 即 不 超出 计算 机 所 能 表示 的 范围 , 则 结果 的 符号 位 和 数值 位 同时 为 
正确 值 。 此 外 ,还 可 以 看 到 ,实现 减 运算 时 ,用 的 仍 是 加 法 器 线路 ,把 减 数 的 负 值 的 补 码 送 加 
法 器 即 可 。 在 有 了 一 个 数 的 补 码 之 后 , 求 这 个 数 的 负 值 的 补 码 , 是 简单 地 把 这 个 数 的 补 码 逐 
位 取 反 再 在 最 低位 加 1 即 可 得 到 。 例 如 ,[Y]# 王 101101, 则 [一 Y]# 一 010011, 这 大 大 简化 
了 加 减 运算 所 用 的 线路 和 加 减 运算 的 实现 方法 。 

下 面 的 问题 是 如 何 检查 加 减 运算 中 的 溢出 问题 。 通 常 有 3 种 表述 方式 (说 法 ) 。 

(1) 两 个 符号 相同 的 补 码 数 相 加 ,如 果 和 的 符号 与 加 数 的 符号 相反 ,或 两 个 符号 相反 的 
补 码 数 相 减 , 差 的 符号 与 减 数 的 符号 相同 ,都 属于 运算 结果 溢出 。 这 种 判别 方法 比较 复杂 ， 
要 区 别 加 还 是 减 两 种 不 同 运算 情况 ,还 要 检查 结果 的 符号 与 其 中 一 个 操作 数 的 符号 的 同 异 ， 
故 很 少 使 用 。 

(2) 两 个 补 码 数 相 加 减 时 , 若 最 高 数值 位 向 符号 位 送 的 进位 值 与 符号 位 送 向 更 高 位 的 
进位 值 不 相同 ,也 是 运算 结果 溢出 。 

(3) 在 采用 双 符 号 位 (如 定点 小 数 的 模 4 补 码 ) 运 算 时 , 若 两 个 符号 位 的 值 不 同 (01 或 
10) 则 是 溢出 。01 表明 两 个 正 数 相 加 ,结果 大 于 机 器 所 能 表示 的 最 大 正 数 , 称 为 * 上 溢 ”;10 
表明 两 个 负数 相 加 ,结果 小 于 机 器 所 能 表示 的 最 小 负数 , 称 为 “下 溢 ”; 双 符号 位 的 高 位 符号 
位 ,不 管 结 果 溢 出 否 , 均 是 运算 结果 正确 的 符号 值 ,这 个 结论 在 乘法 运算 过 程 中 是 有 实际 意 
义 的 。 请 注意 ,在 采用 双 符 号 位 的 方案 中 ,在 寄存 器 和 内 存储 器 存储 数据 时 ,只 需 存 一 位 符 
号 , 双 符 号 位 仅 用 在 ALU 的 线路 部 分 。 

再 次 强调 ,这 3 种 不 同 说 法 是 对 同一 个 事实 的 略 有 区 别 的 表述 。 实 现时 用 到 的 线路 可 
以 有 所 区 别 , 但 问题 的 实质 是 完全 一 样 的 。 请 看 [Xj 十 [Yj 的 运算 情况 : 

01011 10101 10100 10111 001011 110111 
十 01000 十 11000 十 11001 十 10101 十 001000 十 110101 

10011 101101 101101 101000 010011 1101100 

(1) (2) (3) (4) (5) (6) 

这 全 都 是 溢出 情况 .前 4 个 使 用 一 个 符号 位 ,后 2 个 使 用 两 个 符号 位 。 用 前 面 说 的 任何 
一 种 表述 解释 这 里 的 溢出 都 是 可 以 的 。 例 如 ,对 于 (1) .从 正 加 正 得 负 ,或 数据 位 向 符号 位 送 
的 进位 值 为 1, 而 符号 位 送 向 更 高 位 的 进位 值 却 为 0, 二 者 不 相同 ,或 在 (5) 中 使 用 双 符 号 位 
方案 时 ,其 双 符号 位 结果 为 01, 都 是 运算 结果 溢出 。 

几 补 码 加 减 运 算 其 结果 不 属于 上 述 情 况 的 , 均 不 是 溢出 ,结果 的 符号 位 和 数值 位 均 正 
确 。 这 里 虽然 讨论 的 都 是 加 法 运算 ,但 对 减 运算 亦 适 用 。 正 减负 等 同 正 加 正 , 正 减 正 等 同 正 
加 负 , 正 如 前 面 说 过 的 , 减 运算 也 是 用 加 法 器 完成 的 。 例 如 : 
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01011 11101 001011 111101 
H+00100 十 11010 t+000100 十 111010 

01111 10111 001111 110111 

《1) (2) (3) (4) 


(1) 和 (2) 使 用 一 位 符号 位 ,(3) 和 (4) 使 用 两 位 符号 位 ,符号 位 送 向 更 高 位 的 进位 值 ,不 
论 其 值 为 0 或 为 1 一律 在 取 模 后 丢弃 。 
有 了 上 述说 明 , 就 可 以 用 图 3. 4 的 逻辑 线路 





























完成 2 个 补 码 数 的 加 减 运算 。 eT 
运算 前 ,X.Y 寄存 器 分 别 存储 被 加 ( 减 ) 数 和 加 

( 减 ) 数 ,计算 结果 存 回 X 寄存 器 ;F 为 加 法 器 ,能 在 Fp Tr 

命令 X_F 和 普 ->F 信号 的 控制 下 接收 两 个 寄存 器 站 了 /01 高 














中 的 数据 并 完成 加 法 运算 ,运算 结果 在 FX 命令 
信和 号 的 控制 下 接收 回 X 寄存 器 中 。 为 实现 减 运算 ， 
应 将 工 寄存 器 中 补 码 数据 的 负数 表示 送 到 加 法 器 
下 ,这 可 以 通过 送 工 寄存 器 中 每 位 数据 的 反 码 并 在 二 
下 的 最 低位 给 出 进位 1 输入 信号 变通 完成 ,用 了 一 人 

下 和 1_>F 两 个 控制 信号 实现 控制 。 图 3.4 实现 补 码 加 减 运算 的 逻辑 电路 
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3.3.3 原 码 一 位 采 法 、 除 法 的 实现 方案 


1. 原 码 一 位 乘法 的 实现 算法 和 电路 实现 
用 原 码 实现 乘法 运算 是 十 分 方便 的 。 原 码 表示 的 两 个 数 相 乘 ,其 乘积 的 符号 为 相 乘 两 
数 符号 的 异 或 值 ,数值 则 为 两 数 绝对 值 之 积 。 
假定 [Xm=XsX1 Xe X, 
[YJr=YsYY2*… Y, 
则 [XXY]m=[LX]mX [Y] 原 
一 (Xs 中 Ys) (XIX:… Xs) X (YY … Y,) 
结果 是 把 符号 位 和 数值 连接 起 来 。 
为 了 引出 在 计算 机 中 实现 定点 原 码 一 位 乘法 的 具体 方案 , 先 看 手工 乘法 运算 的 实际 执 
行 步骤。 
假定 : X=0.1101 Y=0.1011 
0.1101 
OIolil 


1101 

1101 
0000 
生计 站 本 


OQ XXY 一 0.10001111 ,符号 为 正 
在 手工 计算 时 ,其 算法 与 执行 步 又 如 下 。 
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(1) 依 乘 数 每 一 位 上 的 取 值 为 1 还 是 为 0, 决定 相 加 数 取 被 乘 数 的 值 还 是 取 零 值 。 

(2) 各 相 加 数 从 乘 数 的 最 低位 求 起 , 逐 位 变 高 并 将 相 加 数 逐 个 左 移 一 位 ,最 后 一 步 一 

(3) 符号 位 按 正 乘 正 . 负 乘 负 结果 的 符号 位 为 正 , 正 乘 负 、 负 乘 正 结果 的 符号 为 负 的 方 
案 求 出 乘积 的 符号 。 

在 计算 机 内 实现 原 码 乘法 运算 , 则 不 能 简单 照搬 上 述 方法 ,主要 表现 在 以 下 诸 方面 。 

首先 ,在 运算 器 内 很 难 实现 多 个 数据 同时 相 加 ,通常 只 能 完成 对 两 个 数 的 求 和 操作 。 这 
一 点 比较 容易 解决 ,可 以 每 求 得 一 个 相 加 数 ,就 同时 完成 与 上 一 次 部 分 积 的 相 加 操作 。 

其 次 ,在 手工 计算 时 ,各 相 加 数 逐 个 左 移 一 位 ,最 终 相 加 数 的 位 数 为 相 乘 二 数位 数 的 两 
倍 , 而 在 计算 机 中 ,加 法 器 的 位 数 一 般 与 寄存 器 的 位 数 相同 ,而 不 是 寄存 器 位 数 的 两 倍 。 这 
实际 上 也 可 以 用 另外 的 办 法 加 以 解决 。 手 工 计算 时 ,各 相 加 数 是 逐 位 左 移 一 位 ,但 很 容易 发 
现 , 在 计算 机 内 ,在 每 次 计算 本 次 部 分 积 之 和 时 ,前 一 次 部 分 积 的 最 低 一 位 是 不 再 参与 相 加 
计算 的 。 这 就 意味 着 , 若 采 用 每 求 得 一 次 部 分 积 之 后 使 其 右 移 一 位 , 则 可 以 只 用 N 位 的 加 
法 器 就 能 实现 两 个 N 位 的 数 相 乘 ,并 有 可 能 求 得 双 倍 位 数 的 乘积 。 显 而 易 见 , 若 前 一 次 部 
分 积 已 经 右 移 一 位 ,就 可 以 用 其 高 位 部 分 ,再 用 加 被 乘 数 或 加 零 的 方法 求 得 本 次 的 部 分 积 。 

最 后 ,手工 计算 时 , 乘 数 每 一 位 的 值 是 0 还 是 1 都 能 直接 看 见 ,而 在 计算 机 内 , 若 采用 放 
乘 数 的 寄存 器 的 每 一 位 来 直接 决定 本 次 相 加 数 是 被 乘 数 还 是 零 , 实 现 起 来 是 不 方便 的 , 若 均 
采用 该 寄存 器 的 最 低 一 位 来 执行 这 种 判别 就 简便 多 了 。 为 此 ,可 以 在 每 求 一 次 部 分 积 , 使 放 
乘 数 的 寄存 器 执行 一 次 右 移 操作 即 可 实现 。 若 移 位 时 ,使 其 最 高 一 位 数值 位 接收 加 法 器 最 
低位 的 移 位 输出 , 则 完成 乘法 运算 后 ,该 寄存 器 中 保存 的 将 是 乘积 的 低位 部 分 ,而 原来 的 乘 
数 在 逐 位移 位 过 程 中 已 经 丢失 。 

计算 机 内 求 乘积 的 符号 ,很 容易 用 求 相 乘 二 数 符号 的 半 加 和 ( 异 或 值 ) 实 现 。 

有 了 上 述说 明 ,我 们 就 可 以 得 到 如 图 3. 5 所 示 的 实现 原 码 一 位 乘法 的 逻辑 电路 框图 。 

乘法 开始 时 .A 寄存 器 被 清 为 零 , 作 为 初始 部 分 积 。 被 乘 数 放 在 已 寄 存 器 中 , 乘 数 放 在 
C 寄存 器 中 。 实 现 部 分 积 和 被 乘 数 相 加 是 通过 给 出 A 一 下 命令 和 B 一 下 命令 实现 的 ,部 分 
积 右 移 一 位 送 A 寄存 器 是 通过 把 下 右 斜 一 位 的 命令 下 /2 一 A 来 控制 完成 的 。 







































































移 位 电路 被 乘 数 作为 加 数 ， 用 

eh 

结 晴 和 攀 2 人 
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下 | | 哆 和 到 柔 数 寄存 

器 的 最 高 位 。 
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图 3.5 实现 原 码 一 位 乘法 运算 的 逻辑 线路 框图 






































C 寄存 器 是 用 移 位 寄存 器 实现 的 ,本 身 能 在 移 位 命令 C/2-~C 控制 下 自行 移 位 ,其 最 低位 
的 值 可 用 作 B->F 的 控制 命令 。 请 注意 .加 法 器 最 低 一 位 的 值 . 右 移 时 将 移入 C 寄存 器 的 最 高 
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数值 位 ,使 相 乘 之 积 的 低位 部 分 保存 进 C 寄存 器 中 ,原来 的 乘 数 在 逐 位 右 移 过 程 中 丢失 了 。 

图 3.5 中 还 给 出 了 一 个 计数 器 Cz ,用 来 控制 逐 位 相 乘 的 次 数 。 它 的 初 值 经 常 放 乘 数位 
数 ,以 后 每 完成 一 位 乘 计算 就 使 其 逆向 计数 一 次 . 待 计数 到 0 时 ,给 出 结束 乘 运算 的 控制 信号 。 
图 3.5 中 未 画 出 求 结果 的 符号 的 电路 ,可 以 通过 对 相 乘 两 数 的 符号 执行 异 或 操作 来 完成 。 
计算 机 内 实现 原 码 乘法 的 具体 过 程 如 下 。 

假定 X=0.1101 Y=0.1011 

























































































高 位 部 分 积 低位 部 分 积 / 乘 数 说 明 
00 0000 DD LL 起 始 情况 
十 00 1101 乘 数 最 低位 为 1, 加 六 
00 1101 | 
00 0110 1|1 0 1|1( 丢 失 ) 右 移 部 分 积 和 乘 数 
十 00 1101 乘 数 最 低位 为 1, 加 区 
01 0011 
00 1001 1 1|1 0|1( 丢 失 ) 右 移 部 分 积 和 乘 数 
十 00 0000 乘 数 最 低位 为 0, 加 0 
00 1001 
00 0100 111Ujo (丢失 ) 右 移 部 分 积 和 乘 数 
十 00 1101 乘 数 最 低位 为 1, 加 式 
01 0001 
00 1000 1111l1 (丢失 ) 右 移 部 分 积 和 乘 数 
结果 符号 位 为 正 , 数 值 位 为 10001111。 (GE ) 
这 种 乘法 运算 的 控制 流程 如 图 3.6 所 示 。 
该 图 中 ,数据 的 位 序号 从 左 至 右 移 按 0.1、…\、 的 次 序 编 
排 ,0 位 表示 符号 , 共 ) 位 数值 。 和 Bx 
从 流程 图 上 可 以 清楚 地 看 到 ,这 里 的 原 码 一 位 乘 是 通过 1 
循环 迭代 的 办 法 实现 的 , 即 按 一 定 的 时 间 顺 序 重复 地 使 用 最 Se 
少量 的 硬件 (寄存 器 、 加 法 器 、 移 位 和 传送 门 等 ), 把 整个 乘法 
过 程 变 成 为 数据 经 过 选 通 门 和 加 法 器 实现 相 加 、 移 位 和 寄存 
器 接收 的 时 序 控 制 过程 。 即 把 XXXY 可 写 为 适 
P=21{27[271(27 …(2(0 十 Xy。) 关 A || 
十 ym 十 …Xys) 十 XXyzs] 十 XXy1} 和 
将 上 述 公式 展开 ,可 写成 IE SEE 位 
Po=0 Cd 一 (Cd)1 
Pi = 21(P,+ Xy,) 否 
P: 一 21(P, 十 Xy。) 人 
: 于 ee 
Pa 一 2(P, 十 Xy。) 5 
结束 


P, = 27 (Pi Xy1) 图 3.6 原 码 一 位 乘 运 算 流 程 
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P = P。 
此 处 的 Po、Pi、…、P,-! 称 为 部 分 积 ,P, 为 最 终 的 乘积 P。 

2. 原 码 一 位 除法 的 实现 算法 和 电路 实现 

用 原 码 实现 定点 除法 运算 是 比较 方便 的 ,计算 机 中 经 常用 原 码 的 加 减 交 蔡 法 完成 除法 
运算 。 商 的 符号 为 相 除 二 数 符号 的 异 或 值 ,数值 则 为 二 数 的 绝对 值 之 商 。 

就 讲解 除法 的 实现 原理 而 言 ,恢复 余数 的 除法 方案 更 容易 理解 ,并 很 容易 由 此 推导 出 实 
现 不 恢复 余数 ( 即 加 减 交替 法 ) 的 除法 算法 。 这 种 恢复 余数 的 除法 方案 的 缺点 是 明显 的 , 当 
某 一 次 减 Y 的 差 值 为 负 时 ,要 多 一 次 十 Y 恢复 正 余数 的 操作 ,降低 了 执行 速度 ,又 使 控制 线 
路 变 得 复杂 ,因此 在 计算 机 中 不 被 采用 。 在 计算 机 中 普遍 采用 的 是 不 恢复 余数 的 除法 方案 ， 
它 是 对 恢复 余数 除法 的 一 种 修正 措施 。 

先 看 手工 除法 的 计算 过 程 。 

假定 ”X=0.1011,， Y=0.1101 


0.1101 


0. 1101 /0. 10110 /Y= 二 0.1101, 符 号 为 正 


第 
CD 
章 





1101 余数 二 0.0111 x 2 
10010 
1101 
10100 
1101 
ol11 


手工 计算 二 进 制 除法 的 规则 是 判断 被 除数 与 除数 绝对 值 的 大 小 , 若 被 除数 小 , 则 上 商 
0, 并 把 被 除数 的 下 一 位 移 下 来 ( 若 存 在 ) 或 在 余数 最 低位 补 0, 再 用 余数 和 右 移 一 位 的 除数 
比 , 若 够 除 , 则 上 商 1 否则 上 商 0。 然 后 继续 重复 上 述 步 又 ,直到 除 尽 ( 即 余数 为 零 ) 或 已 得 
到 的 商 的 位 数 满足 要 求 为 止 。 

与 实现 乘法 类 似 的 是 ,在 计算 机 中 ,也 不 能 全 盘 照 搬 手 工 计 算 除 法 的 具体 办 法 。 主 
要 问题 是 ,手工 计算 的 办 法 需要 加 法 器 的 位 数 为 除数 位 数 的 两 倍 ,实现 起 来 不 合理 。 但 
仔细 分 析 一 下 ,会 发 现 右 移 除数 ,可 以 通过 左 移 被 除数 (余数 ) 的 方案 蔡 代 , 左 移出 界 的 被 
除数 (余数 ) 的 高 位 都 是 无 用 的 零 . 对 运算 不 会 产生 任何 影响 。 另 外 一 个 问题 是 ,手工 计 
算 除 法 时 ,上 商 0 还 是 1 是 计算 者 用 观察 比较 的 办 法 确定 的 ,而 在 计算 机 中 ,只 能 用 做 减 
法 后 再 判断 结果 的 符号 为 负 还 是 为 正 来 确定 。 对 恢复 余数 除法 来 说 , 当 减 出 的 差 为 负 
时 ,上 商 为 0, 同 时 还 应 把 除数 再 加 到 负 差 上 去 ,恢复 余数 为 原来 的 正 值 之 后 再 将 其 左 移 
一 位 。 若 减 得 的 差 为 0 或 为 正 值 时 ,就 没有 恢复 余数 的 操作 ,上 商 为 1, 余数 左 移 一 位 。 
第 3 个 问题 是 上 商 , 手 工 除法 中 , 求 商 是 从 高 位 向 低位 逐 位 求 ,而 在 计算 机 内 ,把 求 得 的 
每 一 位 商 直 接 写 进 寄 存 器 的 不 同 的 位 是 不 可 取 的 。 通 常 , 上 商 是 通过 把 求 得 的 每 一 位 商 
上 到 存放 商 值 的 寄存 器 的 最 低 一 位 ,并 把 已 求 得 的 部 分 商 左 移 一 位 。 图 3. 7 给 出 了 实现 
原 码 一 位 除法 运算 的 原理 线路 框图 。 

在 不 恢复 余数 的 除法 方案 中 , 当 某 一 次 减 得 的 差 值 为 负 时 ,不 是 恢复 它 为 正 差 值 后 再 继 
续 运算 ,而 是 设法 直接 用 这 个 负 的 差 值 直接 求 下 一 位 商 , 其 实现 原理 叙述 如 下 。 

(1) 在 恢复 余数 的 除法 运算 中 , 若 第 i 一 1 次 求 商 时 的 余数 为 十 Ri-: ,本 次 上 商 为 1, 下 
一 次 求 商 用 的 办 法 是 





及 ;一 2R-: 一 了 
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图 3.7 实现 原 码 一 位 除法 运算 的 逻辑 线路 框图 


(2) 当 Ri<0 时 ,第 i 位 的 商 上 0, 而 恢复 余数 的 操作 结果 应 为 Ri 二 Y, 下 一 次 , 即 第 ;十 

1 次 求 商 的 减法 操作 是 
Riti=2(Ri+Y)—Y=2R:+2Y—Y=2Ri+Y 

上 述 公 式 表明 , 当 某 一 次 求 商 , 若 减 得 的 差 值 为 负 , 即 R<0 时 ,本 次 上 商 为 0, 继续 求 下 
一 位 商 时 ,可 以 不 必 恢复 正 余 数 ,而 是 直接 将 负 的 差 值 左 移 一 位 (得 2R) 后 ,再 采用 加 上 除数 
的 办 法 来 完成 , 即 通过 判别 2R 十 Y 运算 的 结果 为 正 还 是 为 负 来 决定 商 的 值 。 由 此 可 得 出 不 
恢复 余数 的 除法 运算 规则 如 下 。 

(1) 当 余 数 为 正 时 , 商 上 1, 求 下 一 位 商 的 办 法 是 正 余数 左 移 一 位 ,用 减 去 除数 的 办 法 得 到 。 

(2) 余数 为 负 时 , 商 上 0, 求 下 一 位 商 的 办 法 是 负 余 数 左 移 一 位 ,用 加 上 除数 的 办 法 得 
到 。 即 在 本 方案 中 ,在 求 得 本 位 商 值 的 同时 ,还 要 影响 到 用 减 去 还 是 用 加 上 除数 的 操作 继续 
求 下 一 位 商 ,所 以 不 恢复 余数 除法 又 叫 加 减 交 蔡 除法 。 

下 面 给 出 不 恢复 余数 除法 执行 除 运算 过 程 的 一 个 例子 。 用 的 还 是 X=0. 1011.Y 一 
0. 1101 这 两 个 值 ,LX]# 王 00 1011,[Y]# 王 00 1101,[ 一 Yj]# 二 11 0011。 


























被 除数 商 操作 说 明 

001011 0000|0 开始 情形 
十 110011 =Y 

111110 0000l0 不 够 减 , 商 上 0 

111100 000l00 余数 、 商 左 移 一 位 
十 001101 +Y 

001001 000l01 够 减 , 商 上 1 

010010 00l010 余数 、 商 左 移 一 位 
十 110011 —Y 

000101 00l011 够 减 , 商 上 1 

001010 olo110 余数 . 商 左 移 一 位 
十 110011 —Y 

111101 oljo110 不 够 减 , 商 上 0 

111010 Lo 余数 、 商 左 移 一 位 
十 001101 + 

000111 OTLOL 够 减 , 商 上 1 


运算 结果 , 商 的 数值 位 为 1101, 符 号 位 为 相 除 二 数 符号 的 异 或 值 0, 结 果 为 十 0. 1101。 


数据 表示 ,和 运 草 划 法 和 线路 实现 































































































原 码 一 位 除 的 不 恢复 余数 的 运算 过 程 的 详细 控制 流程 如 图 3.8 所 示 。 
章 
; 4、C-X 
3 Cen 
B= i 
Aon 天 4 一 C4) 十 (B) || 4 一 CO-(B) 
1 过 本 
4--C0-(B) < 人 沙 Y 
扒 N 
C0 Cn 一 1 
内 ps | 上 
Cd 一 (Cd)-1 
N 
1 
[sha | C0 
1 恢 
置 溢出 标志 上 
sl 余 
数 











设置 余数 和 
商 的 符号 











结束 
图 3.8 不 恢复 余数 除法 的 运算 的 控制 流程 


至 此 ,我 们 可 把 定点 原 码 一 位 除 的 实现 方案 小 结 如 下 。 

(1) 除法 运算 首先 需要 检查 出 除数 是 否 为 0, 为 0 则 是 非法 操作 。 

(2) 对 定点 小 数 除法 ,首先 要 比较 除数 和 被 除数 的 绝对 值 的 大 小 ,需要 防止 出 现 数值 溢 
出 的 错误 。 发 现 溢出 , 置 溢 出 标记 后 ,直接 结束 除 运算 的 计算 过 程 。 

(3) 商 的 符号 为 相 除 二 数 的 符号 的 半 加 和 。 

(4) 计算 机 中 用 加 减 交替 法 实现 除法 运算 时 ,被 除数 的 位 数 可 以 是 除 数 的 两 倍 ,其 低位 
的 数值 部 分 ,开始 时 放 在 用 于 保存 商 的 寄存 器 中 。 运 算 过 程 中 ,每 求 出 一 位 商 , 放 被 除数 和 
商 的 寄存 器 同时 左 移 一 位 。 

(5) 在 计算 机 中 , 求 差 和 移 位 是 在 同一 个 操作 步骤 中 完成 的 。 


3.3.4 实现 乘法 、 除 法 的 其 他 方案 


1. 定点 补 码 一 位 乘 的 实现 算法 
在 用 原 码 实现 乘法 运算 时 ,如 相 乘 二 数 原 来 为 补 码 表示 (对 加 减 运算 更 方便 ), 则 在 相 乘 
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之 前 ,要 还 原 负 数 的 补 码 为 它 的 原 码 形式 ; 相 乘 之 后 ,还 要 变 负数 积 的 原 码 为 其 补 码 形式 , 增 
加 了 操作 步骤 。 为 此 ,也 有 不 少 计算 机 直接 用 补 码 相 乘 , 即 用 [Xj]#X[Yj# 直 接 求 [XX 
Yi#。 这 样 做 ,对 两 个 正 数 相 乘 没 任何 问题 。 当 相 乘 的 两 个 数 中 有 一 个 为 负数 ,或 两 个 都 为 
负数 时 ,直接 用 它们 的 补 码 相 乘 , 得 到 的 积 是 否 就 是 LCXXY]# 呢 ?7 下面 我 们 来 分 析 一 下 这 
个 问题 。 

若 LX]# 王 XoXiX:…X, 按 前 面 讲 过 的 , 则 在 LX/2]# 一 XoXoXiX:…X,。 同 理 , 若 已 
有 [X 十 Y]#，, 则 [CX 二 Y)72]# 也 是 将 LX 十 Y]# 的 符号 连同 其 数值 位 同时 右 移 一 位 ,并 使 符 
号 位 保持 不 变 , 这 对 [X+Y]# 的 符号 为 0( 表 示 正 ) 或 为 1( 表 示 负 ) 都 是 正确 的 。 这 表明 ,在 
讨论 补 码 乘 运算 时 ,对 被 乘 数 或 部 分 积 的 处 理 上 与 原 码 乘法 有 某 些 类 似 , 差 别 仅 表现 在 被 乘 
数 和 部 分 积 的 符号 位 要 和 数值 位 一 起 参加 运算 。 

若 [Y]# 王 YoyYiYys…yYy,, 则 当 Yo 为 0 时 ,[LY]# 与 [Y] 和 相同 ,很 容易 证 明 , 直 接 用 [Y]J# 去 
乘 [Xj 处 就 能 得 到 正确 的 [LXXYJ#。 但 当 Yo 为 1 时. 即 Y 为 负 值 时 , 则 有 

Y= 一 1 十 Dy, 这 到 
故 有 
XXXY 一 XX (一 1 十 Fy, x 27)= Xx Py,x2—x 

这 表明 . 当 Y 为 负 值 时 ,用 补 码 乘 计算 LXXYJa， 是 用 [Xj# 乘 上 [Yj 的 数值 位 ,而 不 
用 管 [Yj] 符号 位 上 的 1, 乘 完 之 后 ,在 所 得 的 乘积 中 再 减 X, 即 加 [-XJ]i。 就 是 说 , 当 Y 值 
为 负 时 , 需 对 求 得 的 积 再 做 一 次 加 [-X]# 的 校正 操作 ,得 到 的 才 是 补 码 形式 的 正确 的 积 。 这 
种 方案 需 区 分 乘 数 的 符号 , 按 其 正 负 做 一 步 不 同 的 操作 。 

实现 补 码 乘法 的 另 一 个 方案 是 比较 法 ,是 由 BOOTH 夫妇 最 早 提出 来 的 , 故 又 称 
BOOTH 法 。 这 一 方法 的 出 发 点 是 避免 区 分 乘 数 符号 的 正 负 :, 而 且 让 乘 数 的 符号 位 也 参加 
运算 。 可 以 用 如 下 公式 推导 出 它 的 实现 原理 : 


XXY= XX(—1+ SY, X 2 一 ) ( 逐 项 展开 则 得 ) 








XXC—Y+Y X27 +Y X27 二 十 YX 2™] 
=XX[—Y + X27)+(Y X22 —Y:x2’) 
十 … 十 (Y, X27%"m? 一 YX2™)] (合并 相同 短 次 项 得 ) 
XX[Yi—Y)+ Ym—Y) X27 二 (Ym—Y,) X27" 
十 (0 一 Y,) X 2™] 











= XX Zn 一 Y;) X2 (写成 累加 求 和 的 形式 ,得 到 实现 补 码 乘 运算 的 算法 ) 

由 上 述 公式 可 以 看 到 ,比较 法 是 用 乘 数 中 每 相 邻 的 两 位 判断 如 何 求 得 每 次 的 相 加 数 。 

每 两 位 了 和 Yi+i 的 取 值 有 00.01.10 和 11 这 4 种 组 合 , 则 它们 的 差 值 分 别 为 0.1. 一 1 和 0。 

依据 上 述 公式 可 以 看 出 , 非 最 后 一 次 的 部 分 积 ,分 别 为 上 一 次 部 分 积 的 1/2( 右 移 一 位 ) 的 值 

Ri Ri 十 [LX]#、 且 一 LX]#( 即 玉 十 [一 X]#)》 和 Rj;, 但 一 定 要 注意 ,最 后 一 次 求 出 的 部 分 积 
即 为 最 终 乘积 ,不 执行 右 移 操作 。 

用 此 法 计算 乘积 . 需 在 乘 数 寄存 器 的 低 一 位 之 后 补充 一 位 了 ,+1, 并 使 其 初 值 为 0, 再 增 


数据 表示 ,和 运 草草 法 和 线路 实现 





加 对 辣 和 YY,+1 两 位 进行 译 码 的 线路 ,以 区 分 出 Yt1 一 了 ,的 4 种 不 同 的 差 值 。 对 位 的 数 
(不 含 符号 位 ) 相 乘 ,要 计算 "十 1 次 部 分 积 , 并 且 不 对 最 后 一 次 部 分 积 执行 右 移 操作 。 此 时 
的 加 法 器 最 好 采用 双 符 号 位 方案 。 

2. 定点 补 码 一 位 除法 的 实现 方案 

与 补 码 乘法 类 似 , 也 可 以 用 补 码 直接 完成 除法 运算 , 即 用 [X]#/[YJj# 直接 求 得 [LX/ 
Y]## 。 补 码 除法 的 规则 比 原 码 除法 的 规则 复杂 一 些 。 当 除数 和 被 除数 用 补 表 示 时 ,判别 
是 否 够 除 ,就 不 再 是 简单 地 用 被 除数 (余数 ) 减 去 除数 ,而 是 要 比较 它们 的 绝对 值 的 大 小 。 
因此 ,车 二 数 同 符号 ,要 用 减法 , 若 异 号 , 则 要 用 加 法 ,请 注意 ,这 样 求 出 来 的 商 是 反 码 形 
式 的 。 

我 们 不 准备 对 此 进行 更 多 的 讨论 ,可 以 给 出 如 下 运算 规则 。 

(1) 开始 时 , 求 第 一 位 商 ,如 果 被 除数 与 除数 同 号 , 用 被 除数 减 去 除数 , 若 二 数 异 号 , 则 
用 被 除数 加 上 除数 的 办 法 处 理 。 

(2) 运算 过 程 中 确定 商 的 值 , 若 余数 与 除数 同 号 ,上 商 1, 左 移 一 位 后 下 次 用 余数 减 除数 
操作 求 商 , 若 余数 与 除数 异 号 ,上 商 0, 左 移 一 位 后 下 次 用 余数 加 除数 操作 求 商 。 

(3) 商 的 符号 是 在 第 一 次 求 商 试 算 时 求 出 的 , 若 定点 除 不 溢出 ,得 到 的 就 是 正确 的 符号 
位 的 值 。 

(4) 商 的 修正 问题 。 在 对 精度 要 求 不 高 时 ,将 商 的 最 低 一 位 恒 置 1。 最 大 误差 为 2 一 |。 

若 对 商 的 精度 要 求 较 高 ,可 对 位 数 求 商 n 十 1 次 , 按 得 到 的 不 同 结 果 对 商 进行 修正 。 
当 商 为 负 时 ,要 在 商 的 最 低 一 位 加 1, 从 反 码 的 结果 得 到 商 的 正确 的 补 码 值 。 

再 求 下 去 ,可 得 下 一 位 商 并 舍 入 ;也 可 以 不 执行 最 后 一 步 求 商 操作 ,而 直接 用 在 最 低位 
上 商 1 来 结束 除 运算 过 程 。 

3. 双 位 乘法 的 实现 方案 

为 了 提高 乘法 的 运算 速度 ,也 可 以 选用 两 位 乘法 的 方案 , 即 直接 按 乘 数 的 每 两 位 的 取 值 
情况 ,一 次 求 出 对 应 于 该 两 位 的 部 分 积 ,此 时 只 要 增加 少量 的 硬件 电路 ,就 可 以 使 乘法 的 运 
算 速度 提高 一 倍 , 故 被 广泛 地 用 在 许多 计算 机 中 。 

两 位 乘法 运算 的 方案 , 既 可 以 用 来 实现 原 码 两 位 乘 , 也 可 以 用 来 实现 补 码 两 位 乘 。 

1) 原 码 两 位 乘 

两 位 乘 数 的 取 值 可 以 有 4 种 可 能 组 合 ,每 种 组 合 对 应 于 以 下 操作 : 

(1) 00 相当 于 0XX, 部 分 积 P; 右 移 2 位 ,不 进行 其 他 运算 。 

(2) 01 相当 于 1XX, 部 分 积 Pi; 十 X 后 右 称 2 位 。 

(3) 10 相当 于 2XX, 部 分 积 Pi; 十 2X 后 右 移 2 位。 

(4) 11 相当 于 3XX, 部 分 积 Pi 十 3X 后 右 移 2 位 。 

上 面 出 现 了 十 1X ,十 2X, 十 3X 这 3 种 情况 ,十 X 容易 实现 ,十 2X 可 把 X 左 移 1 位 得 
2X, 在 机 器 内 通常 采用 向 左 斜 1 位 传送 来 实现 。 可 是 十 3X 一 般 不 能 一 次 完成 ,如 分 成 两 次 
进行 ,又 降低 了 计算 速度 。 解 决 问题 的 办 法 是 : 以 十 (4X 一 X) 来 代替 十 3X 运算 ,在 本 次 运 
算 中 只 执行 一 和 ,而 十 4X 则 归并 到 下 一 步 执行 .因为 下 一 步 运算 时 ,前 一 次 的 部 分 积 已 右 移 
了 两 位 ,上 一 步 欠 下 的 十 4X 在 本 步 已 变 成 十 X。 实 际 线路 中 要 用 一 个 触发 器 C 来 记录 是 否 
从 下 十 4X 的 操作 尚未 执行 ,若是 , 则 1 一 C。 因 此 实际 操作 要 用 Y;_1Y;C 这 3 位 的 组 合 值 来 
控制 乘法 运算 操作 ,运算 规则 如 表 3. 10 所 示 。 


才 8 斩 
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如 果 最 后 一 次 运算 时 欠 下 十 4X, 则 部 分 积 右 移 2 位 后 还 需 补 充 完成 十 X 操作 。 
表 3.10 原 码 两 位 乘 运算 规则 


























Yi Y; C 操 作 部 分 积 右 移 
0 0 0 +0 0>C 2 位 
0 0 十 已 0=>C 2 位 
0 1 0 二 天 0 一 C 2 位 
0 1 1 十 2X 0 一 C 2 位 
0 0 十 2X 0 一 C 2 位 
1 0 三 注 1 一 C 2 位 
1 1 0 = 党 1 一 C 2 位 
1 1 十 0 1 一 C 2 位 











2) 补 码 两 位 
我 们 可 以 方便 地 从 上 一 节 讲 的 用 比较 法 实现 补 码 一 位 乘 的 方案 推导 出 补 码 两 位 乘 的 实 
现 原理 。 当 我 们 把 补 码 两 位 乘 理解 为 : 合并 原来 两 步 补 码 一 位 乘 为 单 步 操作 , 则 可 找 出 如 
下 对 应 关系 。 
假定 上 步 乘法 的 部 分 积 为 LP,]# ,本 步 的 部 分 积 应 为 
[PH ]# 一 2-{([LP]# 十 (Yi-: 一 Yi)X[LX]h)} 
此 后 ,下 一 步 的 部 分 积 应 为 
[Pi+z J#=271{[CPin J (Yi— Yi) XCX]#} 
将 第 一 个 公式 中 的 [Piri]# 代 入 第 二 个 公式 中 时 , 则 得 到 
[PazJ#= 271{ 271{ [Pi]# 十 (Ye 一 Yi) X[X]#) + (Yes — Ys) X LX} 
= 27{ [Pi]#+ (CYC—Y) 十 2X(Y-; 一 Yi-) ]X[X]#》 
一 22( [Pi# + [CYanit+ Yi 2X Ys) ] XCLX]s) 《3.17》 
式 (3.17) 表 明 , 在 有 了 部 分 积 LP,]# 之 后 ,再 求 部 分 积 LP+?]#，, 可 用 LP]# 加 上 乘 数 寄存 器 
最 低 两 位 与 附加 位 3 位 值 的 组 合 结果 与 被 乘 数 [Xj# 之 积 、 再 右 移 两 位 得 到 。 
其 中 3 位 值 的 组 合 关 系 为 














Yop + Yo ZX Yi 
代入 它们 的 8 组 取 值 , 则 得 到 如 表 3. 11 所 示 的 结果 。 
表 3.11 补 码 两 位 乘 的 组 合 结果 

















Yai Ya Yan 组 合 值 [Pt] 
0 0 0 0 [PiJa/ 4 
0 0 1 1 (C [PJat CXJ#)/ 4 
0 1 0 1 ( [PiJ#+ [X]#)7 4 
0 1 1 2 ( [LP;] 有 +2[XI#)/ 4 
1 0 0 = C [PiJ#t+2[—X]#)/ 4 
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续 表 
Wj Ya Yi 组 合 值 [Pirs]# 
1 0 1 一 ! 〈[P]# 十 [一 X#)74 
1 1 0 一 1 ([P]# 十 [一 XI]#)74 
1 1 1 0 [PiJ#/ 4 














表 3. 11 结果 表明 ,执行 补 码 两 位 乘 的 过 程 中 ,有 部 分 积 十 [LX]#、 部 分 积 十 [一 X]#、 部 
分 积 十 2LX]# 与 部 分 积 十 2[ 一 X]# 这 4 种 操作 。 除 需要 有 把 LX]#、[ 一 X]# 送 加 法 器 的 线 
路 外 ,还 需要 有 把 LX]#、[ 一 X]# 左 斜 一 位 送 加 法 器 的 线路 。 与 此 相应 的 ,加 法 器 应 使 用 3 
位 符号 位 ,以 避免 [LX]# 左 斜 一 位 送 加 法 器 时 运算 结果 流出 的 情形 。 最 后 一 点 是 ,部 分 积 和 
乘 数 每 次 应 右 移 两 位 ,运算 器 中 应 有 支持 右 移 两 位 的 逻辑 电路 。 

请 注意 : 求 部 分 积 的 次 数 和 右 移 操作 的 控制 问题 。 当 乘 数 由 1 位 符号 和 15 位 数据 位 
组 成 时 , 求 部 分 积 的 次 数 为 (1 十 15)/2, 即 8 次 ,而 且 最 后 一 次 的 右 移 操作 只 右 移 一 位 。 若 数 
值 位 本 身 为 偶数 刀 则 必须 再 增加 一 位 符号 位 ,使 总 位 数 仍 为 偶数 ,此 时 求 部 分 积 的 次 数 为 
n/2 十 1, 而 且 最 后 一 次 不 再 执行 右 移 操作 。 

4. 阵列 乘法 器 

在 3.3. 3 节 介绍 了 手工 乘法 的 执行 过 程 。 原 则 上 ,在 计算 机 内 也 可 以 照搬 这 种 算法 , 即 
用 图 3. 9 所 示 的 一 个 阵列 乘法 器 完成 XXY 乘法 运算 (X= 二 XX2XsaX4,Y 二 Y1YzY3Y4)。 为 
节省 线路 ,可 能 需要 把 多 位 乘 数 划分 成 一 组 ,用 于 乘 运算 的 一 个 步骤, 则 整个 乘法 只 用 几 步 
即 可 完成 。 


每 个 模块 的 内 部 电路 
区 





































































































图 3.9 实现 定点 绝对 值 相 乘 的 阵列 乘法 器 


阵列 的 每 一 行 由 乘 数 Y 的 每 一 位 数位 控制 ,而 各 行 错开 形成 的 每 一 斜 列 则 由 被 乘 数 的 
每 一 数位 控制 。 图 3. 9 中 每 一 个 方 框 都 是 一 个 细胞 模块 (Cellular Module) ,包括 一 个 与 门 
和 一 位 全 加 器 。 该 方案 所 用 加 法 器 数量 很 多 ,但 内 部 结构 规则 性 强 .标准 化 程度 高 , 适 于 用 
超大 规模 集成 电路 的 批量 生产 。 


圳 8 泪 
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5. 用 快速 乘法 器 实现 快速 除法 运算 
按 下 式 完 成 M/D: 


M MXxXFXxFxFxXXF 
D DXFoXFXFs XXF, 


式 中 Fi:(0<i<<7) 为 各 次 递 乘 因子 , 弟 乘 几 次 后 ,可 以 使 DXFoXFiXFX…XF,， 
则 商 应 为 MXFoXFiXF,X…XF,。 
若 M 和 DD 为 规格 化 正 的 二 进 制 小 数 代码 时 ,可 写成 
D=1—86 (0<6<1/2) 

















那么 可 取 的 值 如 下 : 
Fu 一 1 十 9 
Do 一 DXFo 一 (1 一 0)(1 十 0) 一 1 一 好 
Fi=1+8 








Di (1—6)(1+6) 1—6 
可 见 , 当 i 增加 时 ,Di 将 很 快 趋 近 于 1, 其 误差 为 0”。 
实际 上 求 得 Fi 的 过 程 很 简单 , 它 应 为 一 D; 的 补 码 , 即 2 一 Di:(0<i<7)。 
则 可 以 得 到 Q<:0. 1100, 若 算得 更 精确 些 ,可 以 采用 双 倍 字 长 乘 运 算 , 误 差 更 小 , 求 得 的 
商 为 Q=1011 。 





本 章 内 容 小 结 和 学 习 方法 建议 


本 章 提供 计算 机 系统 能 够 处 理 的 常用 的 数据 类 型 及 其 表示 的 基本 知识 ,也 包括 运算 器 
部 件 执行 数据 运算 可 行 计 算 方法 的 数学 基础 。 这 些 内 容 与 布尔 代数 、 数 字 电路 有 一 定 的 联 
系 , 和 计算 机 组 成 与 设计 也 直接 相关 。 认 识 到 这 一 点 很 重要 ,可 以 使 自己 的 学 习 目 标 更 清 
楚 , 明 确 为 什么 需要 学 习 这 部 分 知识 ,这 些 知 识 将 用 到 哪些 地 方 ,怎么 应 用 才能 更 好 地 学 以 
致 用 ,提升 自己 学 习 的 主动 性 和 学 习 效率 。 

本 章 的 教学 内 容 是 以 数字 化 信息 编码 的 概念 二进制 编码 和 不 同 码 制 之 间 的 数据 转换 
为 基础 ,介绍 了 计算 机 中 最 常用 的 基本 数据 类 型 及 其 表示 ,这 些 内 容 是 学 习 、 理 解 和 设计 计 
算 机 硬件 系统 必须 掌握 的 基础 知识 ,是 本 章 重 点 教学 内 容 之 一 。 

本 章 中 另外 一 项 重点 教学 内 容 是 数值 型 数据 的 表示 、 编 码 和 运算 方法 ,包括 定点 小 数 
(主要 应 用 在 浮 点 数 的 尾数 部 分 ) 整数 ( 含 带 符号 的 和 无 符号 的 2 种 类 型 ) 和 浮 点 数 (结合 浮 
点 数 IEEE-754 标准 的 有 关 规 定 )。 这 里 尤其 要 理解 为 什么 要 引入 原 、 反 、 补 码 表 示 及 其 完 
成 运算 用 到 的 方法 ,定点 小 数 、 整 数 补 码 加 减法 的 运算 规则 , 原 码 一 位 乘除 法 的 原理 性 算法 ， 
以 及 如 何 判断 运算 结果 是 否 溢出 ,这 些 是 完成 教学 实验 .设计 实现 简单 CPU 必定 用 到 的 基 
本 知识 。 对 算术 运算 用 到 的 原理 性 逻辑 线路 、 补 码 乘 除法 、 加 速 乘除 运算 的 可 行 方 案 一 般 了 
解 即 可 。 

针对 提高 计算 机 硬件 系统 可 靠 性 的 需要 ,结合 二 进 制 编码 的 概念 ,本 章 中 简单 介绍 了 检 
错 纠 错 码 知识 及 其 应 用 ,要 求 准确 理解 通过 增 大 信息 编码 中 的 最 小 码 距 这 一 措施 来 实现 检 
错 纠 错 的 道理 ,至 于 具体 的 编码 过 程 和 实现 中 所 用 到 的 电路 一 般 了 解 即 可 。 检 错 纠 错 是 提 
高 计算 机 可 靠 性 、 可 用 性 的 重要 手段 .作为 容错 的 一 种 有 效 措施 .在 内 存 读 写 、 外 存 设备 读 
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写 ,数据 传送 (包括 计算 机 网 络 ) 的 过 程 中 得 到 普遍 应 用 ,但 作为 计算 机 组 成 原理 课程 的 教学 
内 容 只 能 是 点 到 为 止 ,不 可 能 更 详细 地 讲解 。 

学 生 在 学 习 计算 机 组 成 原理 课程 的 整个 过 程 中 ,应 该 有 意识 地 把 各 部 分 教学 内 容 的 内 
在 联系 梳理 清楚 , 即 现在 学 习 的 内 容 是 建立 在 哪些 已 经 学 习 过 的 知识 的 基础 上 ,又 会 成 为 此 
后 将 要 学 习 的 哪些 相关 章节 的 必要 准备 ,这 是 一 个 不 断 总 结 、 逐 步 提高 的 认识 过 程 ,切忌 把 
各 章节 的 内 容 孤 立 起 来 , 切 勿 使 装 入 脑子 中 的 新 知识 、 新 概念 和 相关 技术 变 成 一 些 孤 立 离散 
的 内 容 。 认 真 完 成 作业 是 学 懂 本 章 内 容 的 主要 方式 之 一 。 


习题 与 思考 题 


1. 把 下 面 给 出 的 几 个 十 进 制 的 数 转 化 成 二 进 制 的 数 ( 无 法 精确 表示 时 ,小 数 点 后 取 3 
位 ) 八进制 的 数 和 十 六 进 制 的 数 。 

7 中 3/14 一 23/164727.5y 一 125.9375，5.43 

2. 把 下 面 给 出 的 几 种 不 同 进 制 ( 以 下 标 形 式 给 出 在 右 括号 之 后 ) 的 数 转化 成 十 进 制 
的 数 。 

(1010. 0101); ,一 (101101111. 101)。,(23. 47)s ,一 (1A3C. D)ie 

3. 完成 下 面 几 个 二 进 制 的 数 的 算术 运算 。 

1010. 111 十 0101. 101.1010. 111 一 0101. 101.1110X0101.10111101/1101 

4. 回答 奇偶 校 验 码 的 用 途 是 什么 ?” 写 出 下 面 2 个 二 进 制 数 的 奇 ` 偶 校 验 码 的 值 。 

01010111,11010100 

5. 设计 完成 对 8 位 数据 进行 偶 校 验 编码 的 逻辑 线路 和 用 于 检查 已 得 到 的 一 个 偶 校 验 
码 字 的 合法 性 的 迎 辑 电路 。 

6. 汉 明 校 验 码 具有 怎样 的 检 错 纠 错 能 力 ? 为 实现 对 8 位 数据 的 汉 明 校 验 ,应 安排 几 个 
校 验 位 ? 设计 该 汉 明 校 验 码 的 编码 逻辑 表达 式 , 译 码 逻辑 表达 式 。 

7. 用 第 6 题 完成 的 设计 , 写 出 对 应 两 个 8 位 数据 01010111 和 00000000 的 两 个 汉 明 码 
码 字 的 值 ; 若 第 一 个 码 字 中 的 最 低 一 个 数据 位 的 值 由 1 错 变 为 0, 第 二 个 码 字 中 的 最 低 、 最 
高 的 两 个 数据 位 由 0 错 变 成 1, 译 码 后 的 几 个 S 的 值 都 是 什么 ? 

8. 为 什么 在 二 -十 进 制 编码 (BCD 码 ) 中 会 出 现 多 种 编码 方案 ? 何 为 有 权 码 系统 ? 何 为 
无 权 码 系 统 ? 

9. 循环 码 的 特点 是 什么 ? 循环 码 用 于 数值 计算 方便 吗 ? 循环 码 主要 用 于 什么 场合 ? 
证 明 循环 码 为 无 权 码 系统 。 

10. 写 出 下 面 两 组 数 的 原 、 反 、 补 码 表示 ,并 用 补 码 计算 每 组 数 的 和 、 差 。 双 符号 位 的 作 
用 是 什么 ? 它 只 出 现在 什么 电路 之 处 ? 

(1) X=0. 1101 Y=—0.0111 

(2) X=10111101 Y=—00101011 

11. 一 个 C 语 言 程序 在 一 台 32 位 机 器 上 运行 。 程 序 中 定义 了 3 个 变量 +、y 和 <z, 其 中 
工 和 xz 为 int 型 ,y 为 short 型 。 当 x==127,y 二 一 9 时 ,执行 赋值 语句 z==x 十 y 后 ,x、y 和 zz 
的 值 分 别 是 本 

A. z=0000007FH. y=FFF9H. z=00000076H 





坤 8 四 
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B. z=0000007FH. y=FFF9H. > 一 FFFF0076H 
C. x=0000007FH. y=FFF7H. z=FFFF0076H 
D. xz 一 0000007FH， y=FFF7H. > 一 00000076H 
12. 浮 点 数 加 、 减 运算 过 程 一 般 包 括 对 阶 、 尾 数 运算 .规格 化 .输入 和 判 溢出 等 步骤 。 设 
浮 点 数 的 阶 码 和 尾数 均 用 补 码 表示 , 且 位 数 分 别 为 5 位 和 ?7 位 ( 均 含 2 位 符号 位 ) 。 若 有 两 
个 数 X 一 2 X29/32,Y 二 2 X5/8, 则 用 浮 点 加 法 计算 XX 十 Y 的 最 终结 果 是 
A. 00111 1100010 B. 00111 0100010 
C. 01000 0010001 D. 发 生 溢出 
13. 假定 有 4 个 整数 用 8 位 补 码 分 别 表 示 为 疡 =FEH, 一 = 一 F2H,”~ 一 90H,”~ 一 F8H， 
若 将 运算 结果 存放 在 一 个 8 位 寄存 器 中 , 则 下 列 运算 会 发 生 溢出 的 是 。 
A. riXrs: B. r: Xrs CC. nr D. r: Xr 
14. 仿照 计算 机 的 计算 过 程 ,用 原 码 一 位 乘 计算 在 10 题 的 第 (1) 小 题 给 出 的 两 个 定点 
小 数 的 乘积 。 
15. 仿照 计算 机 的 计算 过 程 , 用 原 码 一 位 除 计 算 在 10 题 的 第 (1) 小 题 给 出 的 两 个 小 数 
Y/X 的 商 和 正确 的 余数 。 











第 4 章 
4 运算 器 部 件 


运算 器 分 为 定点 运算 器 和 浮 点 运算 器 两 种 类 型 。 运 算 器 部件 是 计算 机 系统 中 的 执行 部 
件 , 分 担 对 二 进 制 数 据 进 行 各 种 算术 、 逻 辑 运算 ,也 是 计算 机 中 央 处 理 器 CPU 内 部 数据 传 
送 的 重要 通路 。 通 常 由 执行 数据 的 算术 人 逻辑 运算 功能 的 线路 ALU 、 和 暂 存 被 运算 数据 和 中 间 
结果 的 寄存 器 组 (Regs) ,保存 标志 位 信息 的 标志 寄存 器 Flag( 可 能 设置 在 控制 器 芯片 中 ,但 
逻辑 上 把 它 理解 为 运算 器 部 件 的 一 个 组 成 部 分 更 好 理解 一 些 ) 三 部 分 核心 电路 组 成 ,当然 还 
会 用 到 其 他 一 些 辅助 电路 。 本 章 重 点 介绍 运算 器 的 核心 部 件 一 一 算术 逻辑 运算 单元 ALU、 
寄存 器 组 的 组 成 与 工作 原理 。 

在 本 章 将 给 出 3 个 不 同 特点 的 运算 器 实例 。 

第 一 个 实例 是 作者 设计 的 一 个 原理 性 的 8 位 运算 器 模型 ,重点 是 复习 数字 电路 和 逻辑 
设计 的 基础 知识 ,讲解 简单 运算 器 的 功能 设计 及 其 工程 实现 ,会 用 到 ABEL-HDL 硬件 描述 
语言 和 现场 可 编程 的 CPLD 芯片 的 基本 知识 。 

第 二 个 实例 是 20 世纪 70 年 代 初 期 用 在 CISC 结构 的 计算 机 中 的 运算 器 芯片 Am2901， 
将 比较 详细 地 介绍 它 的 组 成 .工作 原理 及 使 用 方法 ,并 用 它 来 构建 教学 实验 设备 中 的 运算 器 
部 件 , 要 求学 生 重 点 关注 。 

第 三 个 实例 是 20 世纪 80 年 代 中 期 使 用 在 RISC 结构 的 MIPS32 计算 机 的 运算 器 部 件 ， 
将 对 它 的 组 成 与 功能 进行 简要 概述 ,并 对 比 它 与 Am2901 运算 器 在 组 成 .功能 ,执行 运算 的 
步骤 等 多 个 方面 的 区 别 。 


4.1 算术 逻辑 运算 单元 的 功能 设计 与 线路 实现 


算术 与 逻辑 运算 线路 是 计算 机 运算 器 部 件 的 核心 电路 ,从 功能 的 角度 看 , 它 要 完成 对 数 
值 数据 的 算术 运算 功能 ,给 出 运算 结果 的 数值 和 结果 的 特征 信息 (例如 结果 的 符号 、 向 更 高 
位 的 进位 、 结 果 是 否 为 0、 结果 是 否 溢出 ) ,还 要 完成 对 逻辑 数据 的 逻辑 运算 功能 。 本 节 将 介 
绍 设计 实现 ALU(Arithmetic and Logic Unit) 的 方法 和 过 程 。 

设计 实现 一 位 加 法 器 的 过 程 是 : 四 写 出 加 法 器 的 真 值 表 ; @@ 用 布尔 代数 写 出 逻辑 表达 
式 ; 回 对 得 到 的 逻辑 表达 式 进行 适当 的 化 简 , 就 可 找 出 所 用 电路 及 其 连接 关系 。 每 一 位 加 
法 器 实现 对 2 个 二 进 制 数 (X,、Y,) 和 一 个 进位 输入 (C,) 的 加 法 运算 ,产生 一 位 的 相 加 之 和 
(S,) ,以 及 一 位 的 进位 输出 (Ca) ,图 4.1 中 给 出 了 这 一 设计 结果 。 
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必 0 0 0 ARE » a 9 
: , > : : S= XY Crt ah, Yn Cat Xn Yn Cnrt Xs Yn Cn * 二 四 5 
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i We | 1 | 
(a) 真 值 表 (b) 逻辑 表达 式 (0) 线路 图 


图 4.1 一 位 加 法 器 的 真 值 表 、 逻 辑 表 达 式 ,线路 图 


如 果 还 希望 把 S, 二 X, and Y,,S, 一 X, or Y, 的 逻辑 运算 功能 也 添加 进去 ,需要 增加 如 
图 4.2 所 示 的 电路 ,用 一 个 与 门 实现 与 运算 ,用 一 个 


















































总 -下 -一 [ 瑟 | 功能 选择 信号 

或 门 实现 或 运算 ,再 将 其 与 加 法 电路 (抽象 为 一 个 矩 问号 二 
形 框 ) 归 并 到 一 起 ,就 得 到 可 完成 算术 和 逻辑 运算 功 草 | > 
能 的 ALU。 加 十 +4- 或 | 或 结果 | 路 | ，。 

此 时 要 使 用 一 个 多 路 选择 器 电路 ,通过 2 位 的 | 
功能 选择 信号 (例如 信号 为 00 输出 加 法 运算 的 和 ， [和 | 
为 10 输出 “与 运算 ”的 结果 ,为 11 输出 “或 运算 " 结 | 一 | 可 生计 位 斩 出 
果 ) ,从 3 个 运算 结果 中 选择 其 一 作为 输出 。 进 位 信 。 c， 有 
号 与 逻辑 运算 无 关 , 只 用 于 加 法 运算 。 图 4.2 一 位 ALU 的 原理 性 组 成 框图 


在 计算 机 系统 中 ,减法 运算 是 用 加 法 器 电路 实 
现 的 ,此 时 需要 把 减 数 每 一 位 取 反 后 送 ALU 的 数据 输入 端 , 并 向 ALU 最 低位 提供 进位 输 
入 信号 1。 此 时 需要 依据 是 加 运算 还 是 减 运算 ,选择 把 Y, 的 值 或 者 Y, 每 一 位 取 反 的 值 送 
ALU ,通常 用 多 路 选择 器 电路 实现 。 

请 注意 ,这 里 给 出 的 只 是 原理 性 线路 ,实际 的 电路 设计 要 经 过 精巧 的 优化 处 理 。 

可 以 用 多 个 一 位 的 ALU 组 成 多 位 的 ALU 部 件 。 图 4. 3 给 出 一 个 4 位 的 ALU 框图 。 
4 位 之 间 要 建立 正确 的 进位 连接 , 低 1 位 的 进位 输出 送 到 相 邻 高 位 作为 进位 输入 。 





























一 位 加 法 器 一 位 加 法 器 一 位 加 法 器 位 加 法 器 
一 | 支持 “或 ”运算 | | (支持 “或 ”运算 | | (支持 “或 ”运算 | | (支持 “或 ”运算 
Cl_“ 与 " 运算 ) | c,| “与 运算) | c,| “与 " 运算 ) |c,| “与 运算) | cv 

泡 和 站 号 汤 沁 A 六 


图 4.3 4 位 的 加 法 器 框图 


在 多 位 的 ALU 线路 中 ,如 果 加 法 运算 的 进位 信号 选用 如 图 4. 3 所 示 的 串 行 方式 传送 ， 
用 的 时 间 比 较 长 ,会 影响 系统 性 能 。 解 决 的 办 法 是 选用 超前 (并 行 ) 进 位 的 方式 处 理 进 位 信 
号 ,实现 思路 是 高 位 加 法 器 不 是 简单 地 等 待 进位 信号 从 最 低位 逐 位 传送 过 来 ,而 是 争取 每 位 
加 法 器 几乎 可 以 同时 得 到 自己 的 进位 输入 信号 ,看 下 面 的 推导 过 程 。 


运算 器 序 件 


第 nln 可 以 取 值 0 一 3) 位 产生 进位 输出 的 条 件 是 : 2 路 数据 X, 和 六, 都 为 1( 此 时 不 必 
关心 低位 送 来 的 进位 信号 ), 记 为 G, 王 X,* Y,, 称 其 为 进位 产生 信和 号 ;或 者 X、Y, 的 和 为 1， 
记 为 P, 二 X, 十 Y, , 称 其 为 进位 传递 信号 ,因为 在 相 邻 低位 送 来 的 进位 信号 C, 也 为 1 时 ( 表 
示 为 P,* C,) 将 产生 进位 。 请 注意 : 这 里 的 符号 ”。 "代表 与 运算 “十 ”代表 或 运算 。 把 位 
序号 0 一 3 代入 表达 式 , 可 得 到 : 












































Cl 一 Xo。Yo 十 (Xo 十 Yo)。Co 一 Co 十 Po。Co 

Cz 一 Xi 十 (XI 二 Yi)。C 一 C 十 Pi。Co 十 PvPo.Co 

Cs = X。Y2: 十 (X: 十 Yz)。C: =G+tP G++P. PI.Go+tP. Pl.Po.Co 
C4 一 Xi 。Ys 十 (Xs 十 Ys)。C3: =Gs+t PG+t+ Ps.: Pe. G+P.P:. Pl.Go 


十 P:。P:。P。Po。Co 

这 表明 ,4 位 加 法 器 几乎 可 以 同时 得 到 自己 的 进位 输入 信号 。 这 是 通过 每 一 位 都 直接 
检查 本 位 的 运算 数据 、 各 低位 的 运算 数据 ,以 及 最 低位 的 进位 输入 信号 完成 的 。 其 代价 是 多 
用 了 一 些 处 理 进 位 信号 的 电路 。 

还 可 以 看 到 , 越 往 高 位 ,用 到 的 门 电路 越 多 , 当 ALU 的 位 数 很 多 (例如 64 位 ) 时 ,就 会 
达到 难以 承受 的 程度 ,可 以 用 分 层 分 组 处 理 并 行进 位 的 方式 来 解决 这 个 问题 。 例 如 ,把 64 
位 ALU 划分 成 4 个 16 位 的 大 组 ,每 个 大 组 再 细 分 成 4 个 4 位 的 小 组 ,参照 上 述 思路 ,按照 
3 个 层次 分 别处 理 小 组 内 部 、 小 组 之 间 、 大 组 之 间 的 并 行进 位 逻辑 。 每 个 小 组 .中 组 、 大 组 都 
提供 本 组 的 G 和 PP 信和 号 ,结合 Co 完成 64 位 的 并 行进 位 。 这 样 总 体 计算 下 来 所 用 的 电路 数 
量 并 不 是 很 多 ,ALU 的 执行 速度 得 到 明显 提高 。 

上 面 的 讲解 还 只 限于 说 明 ALU 的 电路 组 成 和 设计 原理 ,到 了 4. 2. 2 节 , 我 们 会 给 出 一 
个 8 位 字 长 的 原理 性 的 运算 器 模型 .选用 ABEL-HDL 硬件 描述 语言 进行 设计 ,在 现场 可 编 
程 的 CPLD 类 型 的 高 集成 度 的 芯片 内 予以 实现 ,达到 能 够 完成 运算 器 某 些 简单 功能 教学 实 
验 的 目标 ,使 学 生 能 真切 看 到 ,是 如 何 把 一 些 原理 知识 和 设计 技术 转换 成 产品 的 ,又 怎样 检 
测 产品 运行 功能 的 正确 性 。 


4.2 定点 运算 器 


4.2.1 定点 运算 器 部 件 的 功能 、 组 成 与 控制 概述 


运算 器 部 件 是 计算 机 5 大 功能 部 件 中 的 数据 加 工 部 件 。 定 点 运算 器 主要 完成 对 整 型 数 
据 的 算术 运算 和 人 逻辑 型 数据 的 逻辑 运算 功能 。 运 算 器 的 位 数 取决 于 机 器 字 长 ,通常 是 16 
位 、32 位 或 者 64 位 ,将 关系 到 处 理 数据 的 能 力 ; 完 成 一 次 加 法 运算 所 用 的 时 间 决 定 了 计算 
机 CPU 周期 的 长 度 ,将 影响 系统 的 运行 速度 ;运算 器 内 部 包含 的 寄存 器 个 数 将 影响 读 写 存 
储 器 的 频率 ,同样 会 影响 系统 的 运行 速度 。 由 此 可 见 ,运算 器 的 组 成 直接 关系 到 计算 机 系统 
的 数据 处 理 能 力 和 运行 性 能 ,需要 认真 对 待 。 

1. 定点 运算 器 部 件 的 功能 与 组 成 概述 

(1) 运算 器 的 首要 功能 是 完成 对 数据 的 算术 和 逻辑 运算 ,由 其 内 部 的 一 个 被 称 为 算术 
与 逻辑 运算 单元 (ALU) 承 担 。 它 在 给 出 运算 结果 的 同时 ,还 给 出 结果 的 某 些 特征 ,如 溢出 
和 否 , 有 无 进位 输出 ,结果 是 否 为 零 为 负 等 。 这 些 结果 特征 信息 通常 被 保存 在 几 个 特定 的 触 
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发 器 中 。 在 执行 指令 的 过 程 中 ,必须 向 ALU 提供 其 执行 何 种 运算 的 控制 信号 。 在 一 些 计 
算 机 系统 中 ,这 个 ALU 还 用 于 计算 指令 或 者 数据 在 存储 器 中 的 地 址 。 

(2) 运算 器 的 第 二 项 功能 是 暂 存 将 参加 运算 的 数据 和 中 间 结 果 , 由 其 内 部 的 一 组 寄存 
器 REGs 承担 。 因 为 这 些 寄存 器 可 以 被 汇编 程序 员 直 接 访 问 ,通称 通用 寄存 器 ,以 区 别 于 那 
些 计算 机 内 部 设置 的 ,不 能 被 汇编 程序 人 员 访 问 的 专用 寄存 器 。 为 了 向 ALU 提供 正确 的 
数据 来 源 , 必须 向 寄存 器 组 提供 将 使 用 寄存 器 的 编号 。 

(3) 为 了 用 硬件 线路 完成 乘除 指令 运算 ,有 些 早 期 的 运算 器 内 还 有 一 个 能 自行 左右 移 
位 的 专用 寄存 器 ,通称 乘 商 寄 存 器 。 由 于 该 寄存 器 属于 内 部 专用 ,汇编 程序 员 不 能 访问 , 许 
多 计算 机 组 成 原理 教材 和 技术 资料 中 不 太 提 及 此 线路 ,后 来 的 计算 机 不 再 设置 这 个 寄存 器 。 
在 RISC 结构 的 计算 机 系统 中 ,乘除 法 运算 选用 专门 的 阵列 乘除 法 部 件 完成 ,可 以 在 定点 运 
算 中 只 设置 两 个 保存 乘除 法 计算 结果 的 寄存 器 。 

(4) 这 些 部 件 通 过 几 组 多 路 选择 器 电路 实现 相互 连接 ,以 便 数 据 传送 。 通 用 寄存 器 中 
的 数据 移 位 功能 也 在 运算 器 内 部 实现 ,需要 设置 相应 的 电路 。 

(5) 运算 器 还 要 与 计算 机 其 他 几 个 功能 部 件 连接 在 一 起 并 协同 运行 ,就 必须 有 接收 外 
部 数据 输入 和 送出 运算 结果 的 逻辑 电路 。 

运算 器 通常 还 作为 处 理 机 内 部 传送 数据 的 重要 通路 。 

2. 定点 运算 器 的 控制 与 操作 概述 

如 何 让 运算 器 完成 指定 的 运算 操作 功能 ,是 通过 向 其 提供 正确 的 运算 数据 和 控制 信号 
实现 的 。 其 包括 选择 哪 一 个 ( 几 个 ) 数 据 参 加 运算 ,执行 何 种 运算 功能 ,对 运算 结果 (结果 的 
值 和 特征 ) 如 何 保存 与 送出 等 ;同时 要 解决 如 何 接收 外 部 送 来 的 输入 数据 ,怎样 向 外 部 送出 
运算 结果 等 问题 ,正确 给 出 ALU 最 低位 的 进位 信号 ,运算 器 左右 移 位 操作 中 的 移 位 输入 信 
号 等 。 用 到 的 控制 信号 是 由 计算 机 的 控制 器 部 件 提 供 的 ,有 了 这 些 控制 信号 ,运算 器 就 能 完 
成 指定 的 运算 .处 理 功能 。 运 算 器 在 计算 机 系统 中 处 于 执行 部 件 的 地 位 , 受 控制 器 部 件 的 指 
挥 控制 。 


4.2.2 设计 实现 一 个 简单 的 原理 性 8 位 运算 器 模型 


这 是 一 个 原理 性 的 最 简单 的 8 位 运算 器 模型 ,还 达 不 到 实用 水 平 , 但 可 以 把 运算 器 部 件 
的 基本 组 成 和 功能 .把 使 用 ABEL 语言 的 基础 知识 以 及 使 用 CPLD 类 型 器 件 的 操作 过 程 和 
相关 技术 展现 清楚 。 

提供 本 节 教 学 内 容 基于 两 种 考虑 ,对 那些 未 配备 我 们 研制 的 教学 计算 机 设备 的 院 校 ,本 
节 内 容 可 供 学 生 阅 读 ,大 部 分 学 生 应 该 能 够 粗浅 地 读 懂 其 中 运算 器 线路 实现 的 内 容 , 有 利于 
扩展 学 生 视 野 ; 对 已 经 或 准备 配备 我 们 研制 的 教学 计算 机 设备 的 院 校 ,本 节 内 容 可 以 用 于 一 
次 教学 实验 ,学 生 能 够 深入 具体 地 学 习 到 更 多 的 知识 和 实验 技术 ,这 些 知 识 与 技术 在 设计 与 
构建 教学 计算 机 系统 的 整个 过 程 中 会 反复 用 到 。 

1. 确定 运算 器 的 基本 组 成 和 功能 

运算 器 字 长 8 位 ,ALU 能 完成 加 、 减 、 与 .或 4 种 运算 .设置 一 个 累计 寄存 器 。 

ALU 的 两 路 输入 数据 分 别 来 自 累加 器 和 外 部 输入 数据 ,计算 结果 可 输出 显示 ,可 存 人 
累加 器 ,ALU 要 产 出 标志 位 信息 (进位 输出 、 结 果 为 0) ,累加 器 的 内 容 经 三 态 门 控制 显示 。 








和 运算 器 剖 件 


2. 工程 实现 的 有 关 选 择 

要 求 使 用 教学 机 主板 上 的 现场 可 编程 的 ispMACH 芯片 把 这 个 运算 器 实现 出 来 并 可 
以 正确 运行 ,运行 结果 和 有 关 信 息 可 通过 指示 灯 了 予以 显示 ,输入 数据 和 控制 信号 用 开关 
拨 入 。 

可 以 选用 硬件 描述 语言 ABEL-HDL 或 VHDL 来 描述 ispMACH 芯片 内 的 电路 组 成 及 
其 功能 ,我 们 选择 了 ABEL-HDL 语言 ,这 种 语言 最 容易 使 用 ,只 用 到 与 .或 , 非 三 种 门 电路 
和 了 D 型 触发 器 , 写 出 的 程序 结构 简单 ,清晰 易 懂 。 

依据 前 面 的 要 求 , 可 以 画 出 这 个 8 位 运算 器 模型 的 组 成 框图 ,如 图 4.4 所 示 。 
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图 4.4 简单 运算 器 组 成 框图 





从 图 4.4 中 可 以 看 到 ,该 运算 器 的 主要 功能 电路 包括 ALU 和 一 个 寄存 器 Acc。 

ALU 的 2 路 输入 是 B 和 人 A, 都 是 通过 二 选 一 电路 送 来 的 ,B 路 数据 可 以 选 寄 存 器 Acc 
的 输出 (实现 Acc 内 容 累 加 ) 或 0( 用 于 向 Acc 赋 初 值 ) ,A 路 数据 可 以 选 D( 对 应 非 减 运算 ) 
或 D( 对 应 减 运算 ).D 是 由 8 位 开关 提供 的 输入 数据 ;ALU 最 低位 的 进位 信号 c0 在 运算 器 
内 部 按 需 要 产生 。ALU 的 输出 包括 计算 结果 Y( 可 送 到 指示 灯 予 以 显示 ) 和 结果 的 特征 信 
息 ( 进 位 输出 carry 和 结果 为 0 的 标志 zero),carry 和 zero 信号 也 可 以 送 到 指示 灯 予 以 
显示 。 

寄存 器 (累加 器 )Acc 只 能 接收 ALU 的 计算 结果 了 了, 其 输出 被 用 作 ALU 的 B 路 输入 ， 
也 能 经 过 三 态 门 控制 传送 到 指示 灯 予 以 显示 。 

该 运算 器 需要 用 到 4 位 的 控制 信号 .alu_fo .alu_fl 用 于 表示 ALU 的 4 种 运算 功能 
(00: 十 , 01: - ,10: &, 11: #);b_sel 用 于 选择 ALU 的 B 路 数据 来 源 (0: 0 值 ，1: 
Acc) ;oe 用 于 选择 是 否 显示 Acc 的 内 容 (0: 不 显示 , 1: 显示 ) 。 

运算 器 8 位 的 输入 数据 ,4 位 的 控制 信号 分 别 来 自 8 位 开关 和 4 位 开关 ,开关 的 输出 端 
接 有 三 态 控制 门 , 只 有 向 这 2 个 门 电路 的 管 脚 1( 信 号 名 为 k) 提 供 低 电 平 的 控制 信号 ,开关 
的 输出 才能 送 到 运算 器 的 A 路 输入 ,否则 门 电路 的 输出 处 于 高 阻 状态 。 
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下 面 给 出 实现 上 述 运算 器 设计 要 求 的 ABEL 语 


言 程序 ,希望 大 家 能 够 看 懂 , 怎 样 使 用 


ABEL 语言 来 描述 电路 的 组 成 及 其 实现 的 功能 , 即 完成 数字 电路 的 设计 工作 。 


3. 描述 8 位 运算 器 的 ABEL 语言 程序 代码 


MODUIE ispmach "项 目 模块 名 
TITIE 'simple alu' " 慰 题 名 


"program alu8 16.abl 2014/10/06 ”MD 串 行进 位 


LECIARATIONS "说 明 入 出 信号 和 内 部 节点 信号 

clk pin 68; " 叶 钟 信号 

alu fl,alu f0,b sel,ce pin 64..61; " 哈 入 4 位 控制 信号 IR15* IF12 

D7..D0 pin 24,23,26, 25， "输入 8 位 开关 数据 DB15* rB8 
28,27, 30, 29; 

7..Y0 pin 32..39; "显示 AD 的 结果 rB7~ re0 

carry, zero pin 58, 57; "显示 2 个 特征 位 I9 和 IR8 

Acc 7..acc 0 pin 77..70; "显示 累加 器 内 容 2B7~ 2B0 

B7..B0,AT..AD,a sel node istype ‘om'; "au 的 2 路 输入 数据 与 选择 控制 

c8..cl,c0 node istype 'om'; "a 每 一 位 的 进位 入 /出 信号 

PRcc7..ncc0 node istype 'reg,kesp'; "位 的 累加 器 

alu 全 [alu fl,alu_f0]; "定义 集合 ,用 于 简化 逻辑 方程 式 

有 F [7..a0]; EP-[B7..B0]; IF [D7..D0]; 

天 四 ..z0]; Mec= [acc7..acc0]; 

ECURTTCNS "运算 器 的 功能 与 电路 描述 ,用 了 集合 


when b_sel then P=Acc; 
else B= [0,0,0,0,0,0,0,0]; 
whena sel then B= !D; else ED; 
when alu f== [0,1] then {c= 1; a sel=1;} 
Bec.cli= clk; 
[acc 7..acc 0]= acc; 
[acc 71. .Bcc 0] .os= 08; 


Dcc:=Y; 


when (alu f== [0,0])# (alu f= [0,1]) then 

{ YO= BO&a0&c0 # BO&!ADE!CO # !BOgADE!cO # !BO&!RO&c0; 
Y=Bl8Algc] #Bl&!Alg!cl # !BlI&Alg!cl # !Bl&!Algcl; 
Y2= BC&R2&c2 # BC&IR2&!c2 # !B2SR2&!c2 # !B2&!R2&c2; 
Y3= B35A3gc3 # B3&!R3&!c3 # !B3&R3&l!c3 # !B3&!R3&c3? 
Y4= B45n4kc4 # B451!R4&l!c4 # !BASAAE!c4 # !B4&!R4kc47 
Y5= B5&R5&c5 # B5&!R5&!c5 # !B5&R5&l!c5 # !B5&!ASgCS; 
YE= B6&n6sc6 # BEEIAGE!CG # !B65R6&!c6 # !B6&E!IAGECE; 
YE BIEATEcT #B7&!IATE!CT # !B7TSR7T&!c7 # IB7EIATECT; 
Cl= BO&AD # BOgcO # AOgcO; 
Ce=BLSRI # Bl&cl #Algcl; 
C3= BC&R2 # BOgc2 #R2sc27 
C4= B35D3 # B3gc3 # A3gc3; 
C5= BASA4 # BAgc4 # Adgc4; 
C6= B58AS5 # B5gc5 # ASgc5; 


"aD 的 B 路 数据 选择 ,条 件 赋值 语句 

中 _sel=1 选 Bcc, 否 则 选 0 值 

只 路 数据 选择 , 减 运 算 选 !D, 否 则 选 D 

" 仅 在 执行 减 运算 时 co=1,a_sel=1 

"acc 接 收 2D 结果 YY 为 acc 指 定时 钟 

吕 加 器 内 容 送 指示 灯 ,直接 赋值 语句 

咏 zcc 指 定 输出 使 能 信号 ,os=1: 可 显示 
"PD 的 运算 功能 描述 ”00:+， 01:-，10:&, 11:# 

"加 减 运算 

"还 位 计算 和 /元 

" 哇 果 送 指示 灯 显 示 


" 逐 位 计算 进位 输出 
呵 以 送 指示 灯 显 示 
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CI= B65DG # B6&c6 # R6sc67 
C8= B78AT # Bigc7 #A7gc7; } 


when alu f== [1,0] then Ba; 号 运算 , 用 了 集合 
when alu 全 = [1,1] then 

{ YO= BO# RD; Yl= BI# Al; Yo Bo# A2; Y3=B3# A3; 号 运 算 , 未 用 集合 

TB4# PA; Y5= B5# AS; Y6- B6# AG; YI= BN AT; } 喧 的 逻辑 方程 较 多 
" 坦 到 并 显示 0 结果 的 2 个 特征 位 信息 
when (alu f== [0,0]) then carry= c8; "carry=1: 加 运算 有 进位 
when (alu f== [0,1]) then carry= !c8; " 减 运算 有 借 位 
when [Y7..Y0]==“h00 then zerc= 1; "zero=1:AD 的 结果 为 0 
ED 


4. 对 ABEL 语言 程序 的 简要 说 明 

一 个 ABEL 语言 程序 需要 由 头 段 .说 明 段 .逻辑 描述 段 和 结束 段 4 个 基本 部 分 组 成 。 
在 本 例 中 ,程序 的 前 3 行 是 头 段 ,从 DECLARATIONS 开始 的 是 说 明 段 , 从 EQUATIONS 
开始 的 是 逻辑 描述 段 , 最 后 一 行 的 END 是 结束 段 。 

在 说 明 段 ,需要 为 IO 信号 分 配 芯片 管 脚 。 程 序 中 每 一 行 的 开始 是 ABEL 程序 中 的 信 
号 名 ,再 用 pin 指定 信和 号 的 管 脚 编号 ,还 可 以 在 注释 部 分 说 明 信 和 号 的 功能 或 用 途 。 注 释 部 分 
最 后 几 个 字 是 16 位 机 系统 中 使 用 的 信号 名 ,用 于 找到 MACH 芯片 相应 管 脚 在 电路 板 上 接 
线 的 位 置 。 用 node 说 明 的 是 内 部 节点 信号 ,与 IO 信和 号 的 区 别 是 它 没有 和 MACH 芯片 的 
管 脚 相连 接 , 通 常 只 在 芯片 内 部 使 用 ,在 需要 输出 时 ,可 以 通过 逻辑 方程 将 其 连接 到 芯片 的 
可 用 管 脚 。 

信号 的 类 型 ,组合 逻辑 信号 用 istype 'com"' 说 明 . 时 序 逻 辑 信 号 (触发 器 和 寄存 器 ) 用 
istype Yeg,keep" 说 明 , 未 明确 说 明 的 默认 为 是 组 合 逻 辑 信和 号。 

在 逻辑 描述 段 的 开始 一 些 行 ,分 别 写 出 由 b_sel 信号 选择 向 ALU 的 B 路 数据 送 0 值 
(实现 向 Acc 赋 初 值 ) 还 是 累加 器 Acc 的 内 容 ( 实 现 Acc 的 累加 运算 ) ;在 执行 减法 运算 时 
(alu_f 王 王 [0,1]) ,需要 向 ALU 的 A 路 数据 送 入 数据 D 的 反 码 ,并 向 ALU 最 低位 的 进位 
输入 信号 c0 送 1 值 , 确 保 减 法 运算 可 以 使 用 加 法 器 电路 实现 。 

两 个 语句 Acc: 二 Y 和 Acc. clk 二 clk 完成 把 ALU 的 计算 结果 YY 保存 到 累加 器 。 

两 个 语句 [Acc_7.. Acc 0]=Acc 和 [Acc_7.. Acc_0]. oe 二 oe 完成 在 oe 信号 控制 下 把 
累加 器 的 内 容 送 指示 灯 了 予以 显示 ,这 是 通过 在 Acc 的 输出 处 增加 了 一 个 三 态 控 制 来 实 
现 的 。 

在 逻辑 描述 段 的 最 后 一 些 行 ,分 别 写 出 实现 加 ,减法 运算 功能 的 逻辑 方程 和 实现 与 、 或 
运算 的 逻辑 方程 ,以 及 产生 2 个 标志 位 信息 的 逻辑 方程 ,这 些 与 教材 4. 1 节 讲 过 的 内 容 类 似 
但 描述 更 为 精准 。 

加 减法 运算 的 进位 信号 是 逐 位 传送 的 ,属于 串 行进 位 方式 ,其 中 的 进位 输出 信号 carry 
为 1 时 ,表明 加 法 计算 有 进位 ,减法 计算 有 借 位 。 而 逻辑 与 .或 运算 在 相 邻 位 之 间 不 存在 进 
位 关系 , 故 逻 辑 运算 与 carry 信号 无 关 。 

请 注意 ,在 这 个 程序 中 只 用 到 与 .或 非 门 和 DD 型 触发 器 ,还 给 出 了 实现 三 态 控制 的 办 
法 ,在 ABEL 程序 中 ,&&、# 、! 分 别 是 与 或. 非 运算 符 。 

初次 接触 ABEL 语言 程序 的 人 会 感到 某 些 困 惑 ,需要 对 某 些 概 念 做 出 简要 说 明 。 





圩 上 卫 避 
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(1) 信号 需要 在 DECLARATIONS 段 中 通过 一 个 标识 符 予 以 说 明 , 之 后 才能 在 
EQUATIONS 段 中 使 用 。ABEL 程序 中 的 信号 是 对 一 个 硬件 对 象 的 抽象 ,可 以 是 一 个 逻辑 
变量 或 逻辑 常量 . 某 种 类 型 的 一 个 数据 .一 个 器 件 . 电 路 或 者 一 个 部 件 等 ,到 底 是 什么 ,需要 
通过 在 程序 前 后 文中 的 说 明和 使 用 来 确定 。 

(2) 逻辑 型 信号 是 构建 数字 电路 的 基石 ,对 逻辑 信号 最 基本 的 操作 是 赋值 ,包括 直接 赋 
值 和 条 件 赋值 两 种 。 直 接 赋值 是 把 一 个 逻辑 值 或 一 个 逻辑 表达 式 的 计算 结果 一 定 传送 给 这 
个 信号 ,条 件 赋 值 是 在 给 出 的 条 件 成 立时 才 执 行 本 次 赋值 ,还 可 以 指出 条 件 不 成 立时 如 何 处 
理 。 在 ABEL 语言 程序 中 ,接收 赋值 的 信号 写 在 赋值 号 (二 用 于 组 合 逻 辑 电 路 ，: 王 用 于 寄 
存 器 电路 ) 的 左 侧 , 所 赋 的 值 (或 产生 一 个 值 的 表达 式 ) 写 在 赋值 号 右 侧 。 请 注意 如 下 两 点 : 

QO 计算 机 中 的 全 部 电路 都 是 建立 在 逻辑 运算 的 基础 上 ,前 边 给 出 的 8 位 运算 器 中 的 加 
减法 运算 是 使 用 逻辑 门 电路 完成 的 ,描述 加 减法 电路 使 用 的 是 多 辑 运 算 表 达 式 。 

@ 加 减法 运算 使 用 的 都 是 补 码 数 ,包括 开关 提供 的 数据 .运算 的 结果 .Acc 中 的 数据 都 
是 用 补 码 表示 的 ,这 在 本 教材 的 第 3 章 已 经 作为 重点 内 容 多 次 强调 过 了 。 

(3) ABEL 程序 中 的 语句 是 同时 执行 的 ,与 书写 的 前 后 次 序 无 关 , 体 现 的 是 同一 个 电路 
中 的 多 个 器 件 同 时 运行 的 这 个 事实 ,而 软件 算法 语言 中 的 语句 次 序 是 有 实际 意义 的 。 

(4) 若 有 多 个 语句 对 同一 个 信号 的 赋值 操作 ,其 总 的 效果 等 同 于 把 每 一 个 赋值 语句 的 
执行 效果 全 部 按照 "或 ”的 关系 组 合 在 一 起 ,例如 在 前 面 的 程序 中 对 每 一 位 Y 信号 的 赋值 操 
作 就 是 如 此 ,把 加 \ 减 ,与 ,或 4 种 运算 (是 互 斥 关 系 ) 的 结果 “或 "到 了 一 起 。 

(5) 需要 通过 . clk 的 形式 为 寄存 器 电路 指定 时 钟 脉冲 ,D 型 触发 器 只 在 时 钟 信号 的 上 
升 沿 启 动 接收 操作 ,例如 [Acc7. .Acc0]. clk 二 clk; 等 号 左 侧 的 . clk 是 ABEL 语言 的 扩展 属 
性 ,等 号 右 侧 的 clk 是 用 户 选用 的 一 个 IO 信号 ,此 处 的 两 个 clk 代表 的 不 是 同一 个 事情 。 

(6) 需要 通过 . oe 的 形式 为 三 态 门 电路 提供 输出 使 能 信号 ,例如 [Acc7.. Acc0]. oe 二 
oe; 等 号 左 侧 的 . oe 是 ABEL 语言 的 扩展 属性 ,等 号 右 侧 的 oe 是 用 户 选 用 的 一 个 IO 信号 ， 
此 处 的 两 个 oe 代表 的 不 是 同一 个 事情 。 


4.2.3 运算 器 芯片 Am2901 实例 与 使 用 


1. Am2901 的 内 部 组 成 

Am2901 芯片 是 20 世纪 70 年 代 初 的 产品 ,是 一 个 充分 反映 那个 时 期 集成 电路 发 展 
水 平 的 4 位 的 位 片 结构 的 运算 器 器 件 ,虽然 位 数 较 少 但 组 成 完整 ,作为 教学 实例 具有 很 
好 的 典型 性 ,其 内 部 组 成 框图 如 图 4.5 所 示 。 使 用 4 片 Am2901 芯片 可 构成 16 位 字 长 的 
运算 器 部 件 。 

该 芯片 的 第 一 个 组 成 成 分 是 一 个 4 位 的 ALU, 它 的 输出 为 ,两 路 输入 分 别 用 RR 和 5S 
标记 ,还 有 送 入 ALU 最 低位 的 进位 信号 C, .能 实现 RR 十 S、S 一 R、R 一 S 这 3 种 算术 运算 功 
能 和 RVS、RAS.RAS、RDS、R 甸 5S 这 5 种 逻辑 运算 功能 。 在 给 出 运算 结果 的 同时 ,还 送 
出 向 高 位 的 进位 输出 信号 Cr ,溢出 标志 信号 OVR ,最 高 位 的 状态 信号 F; (可 用 作 符号 
位 ), 以 及 运算 结果 为 零 的 标志 信号 FF 二 0000。 

该 芯片 的 第 二 个 组 成 成 分 是 由 16 个 4 位 的 通用 寄存 器 组 成 的 寄存 器 组 。 它 是 一 个 用 双 
端口 (A 口 和 B 口 ) 控 制 读 出 , 单 端口 (B 口 ) 控 制 写 人 的 部 件 。 为 了 对 其 进行 读 写 , 需 通 过 A 地 
址 、B 地 址 指定 被 读 写 的 寄存 器 。 两 路 读 出 数据 分 别 用 A 口 .B 口 标记 .经 锁 存 器 线路 可 以 送 
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到 ALU 的 RS 输入 端的 多 路 选择 器 ,A 口 读 出 数据 还 可 以 用 作 该 芯片 的 可 选 输出 数据 之 一 。 
寄存 器 组 的 写 人 数据 由 一 组 多 路 选择 器 给 出 ,并 由 B 地 址 选择 写 人 的 寄存 器 。 

该 芯片 的 第 三 个 组 成 成 分 是 一 个 4 位 的 Q 寡 存 器 ,主要 用 于 实现 硬件 的 乘法 、 除 法 指 
令 ,能 对 本 身 的 内 容 完成 左 ` 右 移 位 功能 ,能 接收 ALU 的 输出 ,输出 送 到 ALU 的 S 输入 端 。 
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图 4.5 Am2901 芯片 的 内 部 组 成 框图 






























































该 芯片 的 其 余 组 成 成 分 是 5 组 多 路 数据 选择 器 ,每 组 都 由 4 套 电路 组 成 ,每 套 电路 对 应 
一 个 数据 位 ,通过 它们 实现 芯片 内 部 的 3 个 组 成 成 分 之 间 的 连接 ,实现 芯片 内 部 与 外 部 信息 
的 输入 输出 操作 ,包括 经 D 输入 接收 外 部 送 来 的 4 位 输入 数据 ,经 Y 输出 端 输 出 4 位 数据 
到 芯片 外 部 。 请 注意 ,在 实现 寄存 器 数据 左右 移 位 操作 时 ,会 涉及 芯片 内 外 部 的 数据 交换 ， 
左 移 操作 要 求 向 运算 器 的 最 低位 (图 4.5 中 用 ROM。 和 Quo) 送 入 移 位 输入 数据 ,运算 器 的 最 
高 位 (图 4.5 中 用 ROMs 和 Q;) 将 向 外 部 送出 移 位 输出 数据 , 右 移 操作 要 求 向 运算 器 的 最 高 
位 送 入 移 位 输入 数据 ,运算 器 的 最 低位 将 向 外 部 送出 移 位 输出 数据 ,因此 运算 器 的 最 高 位 、 
最 低位 的 移 位 管 脚 必 须 支持 三 态 逻辑 ,以 便 用 于 输入 和 输出 两 个 方向 的 数据 传送 (图 4. 5 中 
用 双向 的 箭头 线 表示 ) ,通用 寄存 器 移 位 和 Q 寄存 器 移 位 都 存在 这 个 问题 。 

2. Am2901 的 控制 与 操作 

为 了 控制 Am2901 运算 器 按 我 们 的 意图 完成 预期 的 运算 操作 功能 ,就 必须 向 其 提供 相 
应 的 控制 信号 和 数据 。 

控制 信号 包括 以 下 3 种 。 

(1) 选择 ALU 的 8 种 运算 (3 种 算术 运算 .5 种 逻辑 运算 ) 功 能 中 的 一 种 。 这 可 通过 提 
供 3 位 功能 选择 码 I; I I 实现 .其 具体 规定 列 在 表 4.1 中 。 

(2) 选择 送 入 ALU 的 两 个 操作 数据 R 和 S 的 组 合 关系 (数据 来 源 )。 4.5 上 已 标 
明 ,R 从 D 和 A 中 选择 ,.S 从 A、B 和 Q 中 选择 ,再 考虑 到 它们 还 均 可 选 0 值 , 则 我 们 可 以 从 
这 许多 可 能 组 合 中 选取 最 有 用 的 8 种 组 合 . 即 A、Q 组 合 .A、B 组 合 .0、.Q 组 合 .0.B 组合 ， 
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0.A 组 合 ,D、A 组 合 ,D、Q 组 合 ,D.0 组 合 ,并 用 I 了 To 这 3 位 操作 数 选择 码 来 控制 二 组 
多 路 选 通 门 选取 其 一 ,具体 规定 如 表 4. 2 所 示 。 


表 4.1 选择 运算 功能 


表 4.2 数据 来 源 选择 





























编 码 运算 编 码 数据 来 源 

本 击 茵 功能 L nh R S 
0 0 0 R+S 0 0 0 A Q 
0 0 1 S—R 0 0 1 A B 
0 1 0 R—S 0 1 0 0 Q 
0 1 1 RVS 0 1 1 0 B 
1 0 0 RAS 1 0 0 0 A 
1 0 1 RAS 1 0 1 D A 
1 1 0 ROS 1 1 1 D Q 
和 1 1 RGS 1 1 1 D 0 











表 4.1 中 的 符号 :“V ”表示 或 运算 ,“ 人 ”表示 与 运算 ,“Q” 表 示 异 或 运算 ,“ 一 ”表示 取 


反 运 算 。 


(3) 选择 运算 结果 或 有 关 数 据 以 什么 方式 送 往 何 处 的 处 理 方案 ,这 主要 指 通用 寄存 器 
组 和 Q 寄存 器 执 不 执行 接收 操作 或 移 位 操作 ,以 及 向 芯片 的 输出 信息 Y 提供 的 是 什么 内 
容 。 这 是 通过 Is 1; Js 这 3 位 结果 选择 码 来 控制 3 组 相应 的 选择 门 实现 的 ,其 规定 如 表 4. 3 
所 示 。3 位 控制 信号 为 000, 通 用 寄存 器 内 容 不 变 ,Q 寄存 器 接收 输入 ;为 001, 通 用 寄存 器 
和 Q 都 不 接收 输入 ;为 010 或 011, 通 用 寄存 器 接收 输入 ,区 别 在 于 向 芯片 外 送出 的 分 别 是 
A 口 读 出 内 容 或 ALU 的 计算 机 结果 ;为 101 或 111, 都 是 通用 寄存 器 接收 输入 ,区 别 在 于 接 
收 的 信息 分 别 是 ALU 的 计算 结果 向 右 或 者 向 左 移 一 位 的 内 容 , 用 在 实现 对 寄存 器 内 容 执 
行 移 位 的 指令 之 中 。 现 在 已 经 不 再 使 用 Q 寄存 器 , 故 不 会 用 到 000、100、110 这 3 个 编码 。 


表 4.3 选择 结果 处 理 方案 





























编 码 结果 处 理 
Ts 四 Ts 通用 寄存 器 组 QQ 寄存器 并 输出 
0 0 0 F—Q F 
0 0 1 F 
0 1 0 下- 了 A 
0 了 -> 如 F 
和 0 0 F/2-»B Q/2—>Q F 
1 0 1 F/2—B F 
1 1 0 2F—>B 2Q-~Q F 
1 1 1 2F—B F 
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关于 该 芯片 的 具体 线路 尚 需 以 下 几 点 说 明 。 

(1) 芯片 输出 数据 还 受 一 个 OE 信和 号 的 控制 , 仅 当 其 为 低 电 平时 , 才 有 了 值 输出 ,否则 
输出 为 高 阻 态 。 标 志 位 下 二 0000 为 集 电 极 开路 输出 ,可 实现 * 线 与 ?逻辑 ,此 管 脚 需 经 一 电 
阻 接 到 十 5V。RAM; 、RAM .Qs .Qo 均 为 双向 人 出 管 脚 ,一 定 要 与 外 部 电路 正确 连接 。 通 
用 寄存 器 组 通过 A 端口 .B 端口 读 出 内 容 均 经 锁 存 器 缓存 .保证 执行 诸如 A 十 B 结果 送 入 B 
运算 操作 的 正确 性 。 

(2) 该 芯片 还 有 两 个 用 于 芯片 之 间 完 成 超前 进位 的 输出 信号 G 和 P ,我 们 未 使 用 。 

(3) Am2901 芯片 要 用 一 个 CLK(CP) 时 钟 信号 作为 芯片 内 通用 寄存 器 、 锁 存 器 和 Q 寄 
存 器 的 时 钟 信号 。 其 有 关 规 定 如 图 4.6 所 示 。 注 意 ,CLK 两 个 跳 变 沿 和 低 电 平 所 实现 的 不 
同 控制 功能 。 


ALU 操 作 周 期 


睛 -一 
系统 时 钟 
| A “寄存 器 接收 


4 口 、8 吕 数据 锁 存 ”通用 寄存 器 接收 
图 4.6 Am2901 的 时 钟 信号 CLK(CP) 的 作用 


3. 外 部 的 数据 及 线路 

有 一 些 数据 是 由 在 芯片 之 外 的 线路 提供 的 ,包括 ， 

@ 芯片 经 DD 端 接收 的 外 部 数据 ; 

@ 芯片 最 低位 的 进位 输入 信号 C,; 

@ 关于 左右 移 位 操作 过 程 中 的 RAM; .RAMo、Q; 和 Qu 的 输入 数据 ; 

@ 需要 在 芯片 外 设置 接收 与 记忆 4 个 标志 位 (Flag) 信 息 的 电路 。 

4. 用 4 片 Am2901 芯片 构建 16 位 的 运算 器 部 件 

教学 计算 机 的 字 长 是 16 位 ,为 此 需要 选用 4 片 Am2901 芯片 构建 运算 器 部 件 , 其 连接 
关系 如 图 4.7 所 示 。 

















































































































DrDn Dui~Ds DD ~Do 
图 4.7 4 片 Am2901 芯片 的 级 联 
图 中 表明 4 个 芯片 之 间 可 以 选择 串 行进 位 或 并 行进 位 (要 用 到 Am2902 芯片 ) 。 从 这 里 
可 以 看 到 前 面 讲 到 的 并 行进 位 .进位 产生 信号 G、 进 位 传递 信号 P 及 其 应 用 实例 。 
最 低位 芯片 的 C, 是 整个 运算 器 的 最 低位 进位 输入 最 高 位 芯片 的 C, 是 16 位 运算 器 的 
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进位 输出 。 只 有 最 高 位 芯片 的 F: 和 OVR 有 意义 ,低位 的 3 个 芯片 的 F: 和 OVR 不 被 
运用 。 

4 个 芯片 的 下 一 0000 管 脚 ( 集 电极 开路 输出 ) 连 接 在 一 起 ,并 经 一 个 电阻 接 到 十 5V 电 
源 , 以 得 到 16 位 ALU 的 运算 结果 为 0 的 标志 位 信和 号。 

其 他 的 几 组 输入 信号 ,对 4 片 Am2901 器 件 来 说 应 有 相同 的 值 , 包 括 OE( 控 制 了 的 输 
出 ) 和 工作 脉冲 CP,A 地 址 .B 地 址 (寄存 器 编号 ) ,Ts ~ 了 To( 控 制 Am2901 的 结果 处 置 ,运算 
功能 ,数据 来 源 ), 故 应 将 这 4 个 芯片 的 这 些 对 应 信号 的 管 脚 连 接 在 一 起 ,如 图 4. 7 所 示 , 请 
注意 图 中 的 某 几 个 引 脚 的 名 字 有 所 变化 。 

这 个 运算 器 芯片 实例 将 用 于 构建 教学 实验 设备 的 运算 器 部 件 ,因此 在 教师 授课 和 学 生 
学 习 的 过 程 中 应 给 予 更 多 的 关注 。 要 学 懂 这 个 运算 器 部 件 的 内 部 组 成 和 使 用 方法 ,这 也 是 
学 好 控制 器 的 必要 准备 ,请 不 要 掉以轻心 。 

对 于 Am2901 运算 器 芯片 的 特点 总 结 如 下 。 

(1) 这 是 一 个 组 成 比较 完整 的 运算 器 ,内 含 ALU 16 个 寄存 器 组 成 的 通用 寄存 器 组 、 用 
硬件 完成 一 位 乘除 法 运算 的 乘 商 寄 存 器 Q .支持 寄存 器 左右 移 位 的 电路 ,用 于 教学 有 很 好 的 
典型 性 ,虽然 单个 芯片 只 有 4 位 字 长 ,但 可 以 很 方便 地 用 4 个 芯片 组 成 16 位 的 运算 器 部 件 。 
其 接收 外 部 输入 数据 和 输出 运算 结果 .送出 状态 位 信息 的 办 法 简单 。 

(2) 这 个 运算 器 使 用 的 控制 信号 组 织 合理 ,用 3 组 3 位 的 控制 信号 分 别 控制 ALU 以 下 
3 个 方面 的 操作 功能 : DALU 的 运算 功能 。@ ALU 两 路 输入 数据 的 来 源 和 组 合 关 系 。 
加 对 本 步骤 执行 结果 的 处 理 方案 ,包括 寄存 器 是 否 接收 ALU 的 运算 结果 .是 否 伴 有 移 位 动 
作 。 向 外 送出 的 16 位 数据 可 以 是 ALU 的 运算 结果 ,也 可 以 是 通过 A 口 读 出 的 一 路 运算 数 
据 , 这 在 修改 堆栈 指针 sp( 即 R,) 时 很 有 用 ,可 以 用 一 个 时 钟 周期 完成 sp 一 1>ar 和 sp 一 1 一 
sp 的 操作 (用 于 堆栈 写 入 ) ,或 者 sp 一 ar 和 sp 十 1>sp 的 操作 (用 于 堆栈 读 出 ) 。 在 芯片 内 
部 ,对 向 芯片 外 送出 的 16 位 数据 都 加 了 用 OE 信号 控制 的 三 态 门 , 可 简单 地 解决 与 其 他 电 
路 分 时 使 用 DB 的 冲突 , 当 OE=0 时 允许 送出 数据 到 DB,OE 王 1 时 这 16 位 数据 的 输出 管 
脚 呈 高 阻 态 ,不 影响 其 他 电路 使 用 DB。 

(3) 选用 寄存 器 组 中 的 哪 一 或 两 个 寄存 器 ,是 通过 向 寄存 器 组 提供 一 或 两 个 4 位 的 寄 
存 器 编号 ( 称 为 A 口 地 址 、B 口 地 址 ) 实 现 的 ,最 为 简单 便捷 。 请 注意 ,执行 读 寄存 器 组 操作 
时 ,可 以 通过 A 口 地 址 .B 口 地 址 同时 读 出 两 个 寄存 器 的 内 容 , 但 在 执行 写 寄 存 器 组 操作 
时 ,只 能 把 B 口 地 址 用 作 接收 写 入 的 寄存 器 的 编号 。 

(4) 需要 向 芯片 提供 时 钟 信号 ,用 于 解决 芯片 内 部 电路 的 时 序 关 系 ,无 须 系 统 的 设计 者 
执行 其 他 辅助 处 理 。 这 就 意味 着 ,只 要 向 运算 器 提供 了 正确 的 17 位 的 控制 信号 ,运算 器 就 
能 够 完成 使 用 者 所 要 求 的 运行 功能 .不 必 担 心 遇 到 线路 的 竞争 冒险 的 问题 。 

(5) 这 个 运算 器 中 能 够 在 一 个 时 钟 周期 完成 一 次 数据 运算 功能 ,可 以 有 效 地 减少 指令 
的 执行 步骤 ,降低 了 控制 器 部 件 的 设计 难度 . 比 起 下 一 节 要 讲 到 的 MIPS32 计算 机 系统 中 的 
运算 器 简单 了 许多 ,相应 地 降低 了 学 生 学 习 的 难度 。 这 也 是 我 们 选择 Am2901 芯片 构建 教 
学 计算 机 系 中 的 运算 器 部 件 的 理由 之 一 。 


4.2.4 MIPS 多 指令 周期 CPU 系统 的 运算 器 的 组 成 及 其 功能 


1. MIPS32 系统 中 的 基本 运算 器 部 件 
MIPS 计算 机 是 20 世纪 80 年 代 中 期 推出 的 典型 RISC 结构 ,是 一 个 非常 成 功 的 系统 ， 





运算 器 部 件 


国内 外 许多 教材 都 把 MIPS 的 指令 系统 和 实现 技术 选 为 教学 内 容 。MIPS 计算 机 的 设计 目 
标 之 一 是 实现 通畅 的 指令 流水 ,这 一 目标 在 运算 器 部 件 中 得 到 充分 体现 。 我 们 将 以 32 位 字 
长 的 机 型 为 例 , 介 绍 MIPS 计算 机 的 运算 器 部 件 。 其 内 部 基本 组 成 如 图 4. 8 所 示 , 包 括 两 个 
重要 部 分 ,一 个 是 由 128 个 寄存 器 组 成 的 寄存 器 组 , 另 一 个 是 执行 数据 运算 的 ALU。 这 个 
运算 器 被 用 于 多 周期 CPU 系统 (对 不 同类 型 的 指令 选用 不 同 数目 的 执行 步骤 ) 时 ,ALU 既 
用 于 计算 数据 ,又 用 于 计算 数据 和 指令 在 存储 器 中 的 地 址 , 故 还 需要 向 ALU 提供 计算 指令 
地 址 的 相关 信息 。 




































































| 
we 1 PC 二 
站 -| | | Zz| 结 果 为 0 标志 
—w|N, 送 
| 松 覃 器 A_selh i 全 | 
| 
组 寄 0 上 8 送 寄存 器 组 
ra ss 存 2 | 
T 器 3 alu_func 
| 及 fp_sel 
写 入 数据 Immed_2 
送 内 存 ”Immed 1 


图 4.8 MIPS 计算 机 的 运算 器 部 件 


寄存 器 组 可 以 使 用 两 个 端口 (Ni 、Nsz ) 控 制 读 出 ,从 寄存 器 组 中 读 出 两 个 寄存 器 的 内 容 
(Qi .Qs) 将 送 到 寄存 器 A 和 B, 作 为 ALU 运算 的 两 路 数据 来 源 ,B 寄存 器 的 内 容 还 可 以 作 
为 写 人 内存 的 数据 。 寄 存 器 组 还 要 用 第 三 个 端口 (No) 提 供 写 入 数据 时 用 到 的 寄存 器 编号 。 

ALU 完成 对 两 路 输入 数据 (A、B) 的 算术 或 者 迎 辑 运算 功能 ,可 向 外 直接 提供 运算 的 结 
果 R( 送 PC) 和 结果 的 特征 信息 Z( 结 果 为 0 标志 ) ,或 将 结果 和 暂 存 于 结果 寄存 器 C 中 ,为 后 
续 操 作 准备 数据 。 需 要 向 ALU 提供 不 同 来 源 的 两 路 数据 ,A 路 可 以 选择 程序 计数 器 PC 或 
者 寄存 器 A 的 输出 ,B 路 可 以 选择 常数 4、 寄 存 器 B 的 输出 或 者 另外 两 路 数据 Immed_1 和 
Immed_2。 这 可 以 组 合 出 A OP B.A OP Immed_1(OP 代表 不 同 的 算数 或 者 逻辑 运算 ) ,PC 
十 4,PC 十 Immed_2 等 多 种 运算 功能 。 前 两 种 组 合用 于 数据 运算 ,包括 两 个 寄存 器 之 间 的 运 
算 ,或 者 一 个 寄存 器 和 立即 数 之 间 的 运算 ;后 两 种 组 合用 于 计算 指令 地 址 ,PC 十 4 得 到 下 条 
相 邻 指令 的 地 址 ,PC 十 Immed_2 得 到 相对 转移 指令 的 地 址 ,更 深入 的 内 容 将 在 控制 器 部 件 
的 章节 进行 说 明 。 

2. 运算 器 部 件 的 工作 过 程 和 需要 的 控制 信号 

请 注意 ,在 这 个 运算 器 部 件 中 完成 一 次 数据 运算 要 用 3 个 时 钟 周期 ,有 利于 实现 指令 流 
水 。 首 先是 从 寄存 器 组 读 出 寄存 器 内 容 并 缓存 (需要 提供 被 读 的 两 个 寄存 器 的 编号 rs 和 
rt) ,之 后 ALU 执行 运算 并 和 暂 存 (需要 提供 数据 来 源 选 择 信号 A_sel 和 B_sel, 以 及 ALU 的 
运算 功能 选择 信号 alu_func) ,最 后 一 步 才 会 把 暂 存在 寄存 器 C 中 的 计算 结果 写 回 寄 存 器 组 
(需要 提供 被 写 的 寄存 器 编号 rd, 写 寄存 器 组 的 命令 信号 we)。 寄 存 器 组 和 3 个 寄存 器 A、 
B.C 都 要 用 到 时 钟 信号 Clock。 这 与 Am2901 运算 器 用 一 个 时 钟 周 期 完成 一 次 数据 运算 
不 同 。 

有 关 这 个 运算 器 的 其 他 内 容 , 将 到 6.2. 2 节 的 MIPS 的 控制 器 部 件 实例 中 进一步 说 明 。 


第 
人 
章 





计算 机 组 成 与 体系 结 攀 (第 3 版 ) 





4.3 浮 点 运算 和 浮 点 运算 器 


浮 点 运算 器 是 主要 用 于 对 计算 机 内 的 浮 点 数 进行 运算 的 部 件 。 浮 点 数 通常 由 阶 码 和 尾 
数 两 部 分 组 成 , 阶 码 是 整数 形式 的 ,尾数 是 定点 小 数 形式 的 。 这 两 部 分 执行 的 操作 不 尽 相 
同 。 因 此 , 浮 点 运算 器 总 是 由 处 理 阶 码 和 处 理 尾 数 的 这 样 两 部 分 逻辑 线路 组 成 。 本 节 将 从 
浮 点 数 运算 的 实现 算法 和 浮 点 运算 器 的 组 成 特点 两 个 方面 ,来 讨论 浮 点 运算 器 的 有 关内 容 。 
为 了 平衡 各 章节 的 教学 负担 ,我 们 没有 把 浮 点 数 的 表示 和 运算 的 实现 算法 放 在 第 3 章 , 而 是 
拿 到 这 里 和 浮 点 运算 器 安排 在 一 起 进行 讲解 。 


4.3.1 浮 点 数 的 运算 规则 


前 面 已 讲 到 , 浮 点 数 通 常 被 写成 如 下 形式 : 
X= Me X 2 

浮 点 数 通 常 有 两 种 表示 方式 ,一 种 表示 方式 用 于 运算 过 程 ,出 现在 浮 点 运算 器 内 部 ,此 
时 的 M: 是 浮 点 数 的 尾数 ,机 器 中 多 用 原 码 表示 ,不 使 用 隐藏 位 技术 ,是 绝对 值 小 于 1 的 规格 
化 的 二 进 制 小 数 。E; 为 该 浮 点 数 的 阶 码 , 机 器 中 多 用 移 码 表示 ,一般 为 二 进 制 整数 ,给 出 的 
是 浮 点 数 表 示 中 的 实际 指数 的 寡 十 128(8 位 阶 码 时 ) ,而 该 指数 的 底 通 常 选用 2。 另 外 一 种 
表示 用 于 浮 点 数 的 存储 过 程 , 对 于 规格 化 的 非 0 值 的 浮 点 数 使 用 隐藏 位 技术 , 即 隐 去 规格 化 
尾数 最 高 一 位 上 的 数值 1, 剩 余 尾 数 再 左 移 一 位 ,并 相应 地 把 阶 码 部 分 的 值 减 1, 变 为 实际 指 
数 的 寡 十 127(8 位 阶 码 时 )。 这 样 做 既 不 影响 实际 运算 ,保存 过 程 中 尾数 又 多 一 个 二 进 制 位 
的 精度 。 

1. 浮 点 加 减法 的 运算 步骤 

假定 有 两 个 浮 点 数 

X= M.X2s, Y= M,x2s 

实现 X 士 Y 运算 ,要 用 如 下 多 步 完成 。 

(1) 计算 阶 差 操作 , 即 比 较 两 个 浮 点 数 的 阶 码 值 的 大 小 , 求 AE=E, 一 E,。 

(2) 当 阶 差 AE 不 等 于 零 时 ,首先 应 使 两 个 数 取 相 同 的 阶 码 值 。 其 实现 方法 是 ,把 原来 
阶 码 小 的 数 的 尾数 右 移 | AE| 位 ,其 阶 码 值 取 大 的 阶 码 值 , 则 该 浮 点 数 的 值 不 变 ( 但 精度 变 差 
了 )。 为 减少 误差 ,可 用 另外 的 线路 ,保留 右 移 过 程 中 移出 去 几 位 值 ,用 于 以 后 舍 入 。 

(3) 实现 尾数 的 加 ( 减 ) 运 算 , 即 对 两 个 完成 对 阶 后 的 浮 点 数 执行 求 和 ( 差 ) 操 作 。 

(4) 规格 化 处 理 ,完成 对 不 满足 规格 化 规则 的 计算 结果 的 规格 化 操作 。 

(5) 有 时 还 需要 执行 伟人 操作 。 舍 人 的 总 的 原则 是 要 有 含有 和 人 ,而且 尽量 使 舍 和 入 的 
机 会 均等 ,以 防止 误差 积累 。 常 用 的 办 法 有 0 舍 1 入 法 , 即 移 掉 的 最 高 位 为 1 时 , 则 在 尾数 
末 位 加 1; 移 掉 的 最 高 位 为 0 时 , 则 舍 去 移 掉 的 数值 。 该 方案 的 最 大 误差 为 2-“+? 。 另 一 种 
方法 是 恒 “ 置 1” 法, 即 右 移 时 ,丢掉 移出 的 那些 低位 上 的 值 ,并 把 结果 的 最 低位 置 成 1。 还 有 
更 精确 的 舍 人 处 理 方案 ,在 此 不 子 介 绍 。 

(6) 接 下 来 还 要 判断 结果 的 正确 性 , 即 检查 溢出 。 浮 点 数 的 溢出 是 以 其 阶 码 溢出 表现 
出 来 的 。 在 加 减 运算 真正 结束 前 ,要 检查 是 否 产 生 了 溢出 , 若 阶 码 正常 ,加 ( 减 ) 运 算 正常 结 
东 ; 若 阶 码 下 溢 , 要 置 运 算 结 果 为 浮 点 形式 的 机 器 零 , 若 上 滋 , 则 置 溢出 标志 。 





和 运算 器 吉 件 


规格 化 浮 点 加 减 运 算 流程 如 图 4. 9 所 示 。 
ba 





求 阶 差 : E=|E 一 El 








保留 大 阶 : E=max(E,E) 








对 阶 : 阶 码 小 的 数 尾数 右 移 E 位 








尾数 加 减 运 算 














| 尾数 加 减 结果 判断 与 处 理 | 

















右 规 : 尾数 左 规 : 尾数 
右 移 一 位 ，E+1| | 左 移 k 位 ，E+k 








舍 入 : 得 规定 尾数 的 尾数 
全 0 











Ne 右 规 ; 尾数 
M 判 溢出 “上 下 | 有 移 一 位，Eal 

































置 机 器 0 : 已 =-max 
M=0 





X=X+Y X=X-Y 
图 4.9 规格 化 浮 点 加 减 运算 


看 一 个 浮 点 数 加 法 运算 的 实例 。 假 定 浮 点 数 的 阶 码 为 4 位 ,选用 十 8 的 移 码 表示 ,尾数 
为 8 位 ( 含 符号 位 ) ,用 原 码 表示 。 则 当 X 王 2 X0. 1101111,Y 王 2 X( 一 0. 1010110) 时 ， 
则 它们 的 浮 点 数 表示 分 别 为 : 
[Xj# 二 0 1010 1101111 (1 位 符号 位 ,4 位 阶 码 ,7 位 尾数 数值 位 ) 
[YjJ# 二 1 1100 1010110 (1 位 符号 位 ,4 位 阶 码 ,7 位 尾数 数值 位 ) 
执行 XX 十 Y 的 过 程 如 下 。 
(1) 求 阶 差 对 阶 。 E=E, 一 E,==[E,]g 十 [一 E,]# 二 1 010 十 1 100=1 110, 即 AE 
为 一 2。 
请 注意 , 移 码 数 相 加 是 对 相 加 得 到 的 符号 位 求 反 后 才 是 正确 移 码 符号 位 的 值 。 
(2) 对 阶 。X 的 阶 码 小 ,应 使 M; 右 移 两 位 , 尼 . 取 值 为 4, 得 [Xjx 二 1100 0 001101111， 
用 另外 的 线路 保存 X 尾数 的 最 低 2 位 .用 于 伟人 。 注 意 , 本 步骤 已 把 数 的 符号 移 到 尾数 数 
值 位 之 前 了 。 
(3) 尾数 求 和 。 此 处 是 原 码 相 加 ,执行 的 是 M, 一 M,。 














坤 也 梁 
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0 0011011 站 于 
+11010110 
10111010 ,01， 
(4) 规格 化 处 理 。 尾 数 的 最 高 位 为 0, 应 执行 左 规 1 位 处 理 , 结 果 为 1 111010010， 阶 码 
减 1, 为 1011。 
(5) 伟人 处 理 。 采 用 0 售 1 入 法 处 理 ,把 最 低位 之 后 警戒 位 上 的 1 加 到 尾数 中 ,最 终结 
果 为 1 1110101。 
(6) 判 溢出 。 阶 码 为 1 011, 不 溢出 。 将 此 结果 还 原 成 正确 的 浮 点 数 表示 , 则 得 1 1011 
1110101 , 故 得 最 终结 果 为 X 十 Y=2*" X( 一 0.1110101) 。 
2. 浮 点 数 乘除 法 运算 步骤 
浮 点 数 相 乘 ,乘积 的 阶 码 应 为 相 乘 的 两 数 的 阶 码 之 和 ,尾数 应 为 相 乘 两 数 的 尾数 之 积 。 
浮 点 数 相 除 , 商 的 阶 码 应 为 被 除数 的 阶 码 减 
去 除数 的 阶 码 得 到 的 差 ,尾数 应 为 被 除数 的 尾数 
除 以 除数 的 尾数 所 得 的 商 。 规 格 化 浮 点 乘除 运算 






对 对 | 4 


阶 码 相 加 ] | _ 尾 数 相 乘 得 两 售 位 长 结果 




















流程 如 图 4. 10 所 示 。 形成 结果 | 尾数 乘 结果 判断 
乘 、 除 运算 都 可 能 出 现 结果 溢出 或 结果 不 满 1 有 ! 个 类 "0" 
足 规格 化 要 求 的 问题 ,因此 也 必须 进行 这 些 检查 和 








和 处 理 。 与 加 减法 运算 类 似 的 是 , 乘 .除法 的 浮 点 


合 入 : 得 规定 尾数 的 尾数 
数 运算 也 有 个 精度 处 理 要 求 , 舍 人 矛盾 似乎 更 突 全 “0" 全 和 
































出 一 点 。 下 面 就 阶 码 运算 和 尾数 舍 人 问题 进行 判 M 溢 出 | | 石 规 : 以 右 移 
讨论 。 TE 溢出 [二 位 ， 9 
不 溢出 
1) 浮 点 数 的 阶 码 运算 阶 码 结果 判断 与 处 理 
对 阶 码 的 运算 主要 有 十 1 一 1、 阶 码 求 和 、 阶 下 洲 正常 性 溢 














码 求 差 4 种 ,运算 时 还 必须 进行 溢出 检查 。 在 计 。[ 置 机 器 0: 5 一 max, M=0] | | 加 上 溢 标 志 
算 机 中 , 阶 码 通 常用 移 码 形式 表示 , 当 对 nn 位 的 移 
码 选用 移 2" ?的 方案 时 , 移 码 的 定义 为 

[Xj# =2+X—2<X<2"(Mod 2") 
按 此 定义 , 则 有 





X=XXY 
图 4.10 规格 化 浮 点 乘法 运算 








[LXJ]# 十 [Y]e 一 2" 十 X 十 2" 十 Y 一 2" 十 (2" 十 X 十 Y) 
2 二 [区 十 了] 

上 述 表 达 式 表明 ,在 直接 用 移 码 实现 求 和 运算 时 ,结果 的 最 高 位 (符号 位 ) 多 加 了 个 1， 
要 得 到 正确 的 移 码 结果 ,必须 对 计算 得 到 的 符号 再 执行 一 次 求 反 操作 。 

2) 浮 点 数 的 尾数 处 理 

在 计算 机 中 , 浮 点 数 的 尾数 总 是 用 确定 的 位 数 来 表示 的 ,但 浮 点 数 的 运算 结果 却 常常 超 
过 给 出 的 位 数 ,如 加 减 运算 过 程 中 的 对 阶 和 右 规 处 理 , 会 使 尾数 低位 部 分 的 一 位 或 多 位 的 值 
丢失 ;乘除 运算 也 可 有 更 多 位 数 的 结果 ,有 多 种 办 法 处 理 多 出 来 的 这 些 位 上 的 值 , 称 为 伟人 。 

第 1 种 办 法 ,是 无 条 件 地 丢掉 正常 尾数 最 低位 之 后 的 全 部 数值 , 称 为 截断 处 理 , 处 理 简 
单 但 影响 结果 的 精度 。 

第 2 种 办 法 ,运算 过 程 中 保留 右 移 中 移出 的 若干 高 位 的 值 ,最 后 再 依据 这 些 位 上 的 值 修 




















运算 器 部 件 


正 尾 数 , 称 为 伟人 处 理 , 有 利于 提高 结果 的 精度 。 
对 原 码 表示 的 正 、 负 数 的 尾数 ,伟人 规则 比较 简单 。 最 简便 的 是 0 售 1 和 法 ;也 可 以 只 
要 尾数 最 低位 为 1, 或 移出 的 几 位 中 有 为 1 的 数值 位 ,就 使 尾数 最 低位 的 值 为 1 。 

下 面 给 出 浮 点 数 相 乘 的 一 个 实际 的 例子 。 假 定 浮 点 数 的 阶 码 为 4 位 的 移 码 ,尾数 ( 含 符 
号 位 ) 为 8 位 的 原 码 ,并 规定 不 用 隐 含 位 , 阶 码 的 底 为 2, 乘 法 的 结果 尾数 仍 保留 8 位 ( 含 符 
号 位 ) ,直接 用 原 码 完成 尾数 的 乘法 运算 ,用 0 舍 1 和 方法 进行 伟人 。 

假定 X 王 2 一 X0.1110011,Y 一 2 X( 一 0.1110010) , 则 二 数 的 浮 点 表示 为 

[Xj]#=0 011 0 1110011,[YJ#=1 011 1 1110010 

和 XXxY 的 执行 步 又 如 下 。 

(1) 乘积 的 阶 码 为 二 数 阶 码 之 和 ,用 公式 [E. 十 已 ,]# 王 [LE.]# 十 [LE,]s, 则 有 0 011 十 
1 011 二 0 110, 结 果 为 移 码 表示 的 一 2。 

(2) 原 码 尾数 相 乘 的 结果 为 1 11001100110110 。 

(3) 规格 化 处 理 , 已 满足 规格 化 要 求 ,不 需 左 规 , 尾 数 不 变 , 阶 码 仍 为 0110。 

(4) 舍 人 处 理 , 按 舍 人 规则 ,尾数 之 后 的 4 位 为 0110, 可 以 直接 舍 掉 。 

所 以 相 乘 结果 的 最 终 值 为 [LXXY]# 二 1 0110 1100110, 其 真 值 为 2 X( 一 0. 1100110) 。 

执行 浮 点 数 除法 的 计算 与 浮 点 数 乘法 的 运算 步骤 类 同 , 此 处 不 再 袭 述 。 

3， 有关 浮 点 数 运算 和 浮 点 运算 器 的 一 点 补充 说 明 

1) 阶 码 的 底 为 8 或 16 的 情况 

前 面 的 讨论 都 是 以 阶 码 值 的 底 为 2 来 进行 的 。 为 了 用 相同 位 数 的 阶 码 表示 更 大 范围 的 
浮 点 数 ,在 一 些 计算 机 中 .也 有 选用 阶 码 的 底 为 8 或 16 的 情况 ,此 时 被 表示 成 

X=8=XM, 或 X=16%XM, 
此 时 阶 码 E, 和 尾数 M, 还 都 是 用 二 进 制 表示 的 ,其 运算 规则 ,与 阶 码 以 2 为 底 时 基本 相同 ， 
但 关于 对 阶 和 规格 化 操作 必须 有 新 的 相应 规定 。 

当 阶 码 以 8 为 底 时 ,只 要 原 码 尾数 满足 1/8 三 | M,| 就 是 规格 化 表示 形式 , 即 尾数 数值 
的 最 高 3 位 中 至 少 要 含有 1 位 1。 执 行 对 阶 和 规格 化 操作 时 ,每 当 阶 码 的 值 增 1 或 减 1, 尾 
数 要 相应 地 移 3 位 。 

当 阶 码 以 16 为 底 时 ,只 要 原 码 尾数 满足 1/16 过 | M | 就 是 规格 化 表示 形式 , 即 尾数 数 
值 的 最 高 4 位 中 至 少 要 含有 1 位 1。 执 行 对 阶 和 规格 化 操作 时 ,每 当 阶 码 的 值 增 1 或 减 1， 
尾数 要 相应 地 移 4 位 。 

2) 浮 点 数 的 阶 码 用 移 码 和 尾数 用 原 码 表示 的 优点 

尾数 的 符号 位 在 浮 点 数 表示 的 最 高 位 ,比较 两 个 浮 点 数 的 大 小 时 ,符号 非常 重要 , 正 数 
一 定 大 于 负数 。 阶 码 的 位 置 在 机 器 数 表 示 中 ,处 在 符号 位 和 尾数 值 之 间 , 阶 码 值 大 的 ,其 移 
码 形式 的 机 器 数 也 大 ,与 原 码 表示 的 尾数 配合 起 来 更 便于 比较 浮 点 数 的 大 小 。 

移 码 的 最 小 值 是 各 位 均 为 0。 它 通常 可 以 被 用 来 表示 机 器 零 , 即 当 阶 码 的 值 小 于 或 等 
于 移 码 所 能 表示 的 最 小 值 时 ,认为 浮 点 数 的 值 为 0。 此 时 的 机 器 0 为 阶 码 和 尾数 均 为 0 的 
形式 ,给 硬件 的 判 零 带 来 很 大 方便 。 

4. 关于 IEEE 浮 点 数 标准 754 的 有 关 规 定 

从 简化 课程 讲授 和 易于 理解 的 角度 ,在 前 面 对 浮 点 数 的 文字 说 明和 运算 实例 中 ,都 是 围 
绕 基本 原理 进行 的 。 当 浮 点 数 的 阶 码 为 8 位 时 ,采用 的 是 移 128 的 方案 ,也 没 讨论 在 尾数 中 
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使 用 的 隐藏 位 技术 ,是 比较 传统 的 做 法 ,这 与 IEEE 浮 点 数 标准 754 的 实际 规定 有 一 些 差 
别 。 在 IEEE 浮 点 数 754 标准 中 ,规定 浮 点 数 的 尾数 使 用 原 码 表示 ,对 规格 化 的 非 0 值 尾数 
使 用 隐藏 位 技术 。 对 短 ( 单 精度 ) 浮 点 数 ( 阶 码 8 位 ) 采 用 的 是 移 127 的 移 码 方案 ,对 长 浮 点 
数 ( 阶 码 11 位 ?采用 的 是 移 1023 的 移 码 方案 。 

原 码 尾数 中 使 用 隐藏 位 技术 是 指 把 非 零 值 的 规格 化 浮 点 数 的 尾数 最 高 位 上 的 1 强行 去 
掉 (隐藏 起 来 )。 这 是 通过 左 移 原 来 的 尾数 实现 的 。 其 效果 是 使 结果 的 表示 精度 多 出 了 1 个 
二 进 制 位 , 短 浮 点 数 的 有 效 精度 从 23 个 二 进 制 位 变 到 24 个 二 进 制 位 。 考 虑 到 隐藏 位 和 剩 
余 尾 数 , 则 此 时 它 所 代表 的 实际 值 在 1 一 2 之 间 。 

在 移 127 的 移 码 方案 中 ,8 位 移 码 结果 不 再 与 8 位 的 补 码 存在 仅 符号 位 相反 的 对 应 关 
系 。 其 值 要 通过 对 阶 码 的 实际 值 加 127 来 得 到 , 即 当 阶 码 分 别 为 一 126 .一 125、 一 2、 一 1.0、 
十 1. 十 2 和 十 127 时 ,8 位 的 移 码 是 00000001、00000010、01111101、01111110、01111111、 
10000000、10000001 和 11111110 这 8 个 数字 。 可 以 表示 的 规格 化 浮 点 数 的 阶 码 值 在 
一 126 一 十 127 之 间 。 

移 码 形式 的 阶 码 值 00000000 和 11111111 被 分 派 特定 的 用 处 。 当 移 码 值 为 00000000 
时 ,过 去 简单 的 处 理 办 法 是 强行 置 尾数 结果 也 为 0 值 ,就 是 过 去 说 的 机 器 0; 到 了 IEEE 标 
准 , 则 可 以 用 其 表示 非 规格 化 浮 点 数 。 此 时 不 能 再 使 用 隐藏 位 ,只 要 尾数 23 位 上 不 是 全 0， 
都 属于 能 表示 的 、 非 规格 化 的 浮 点 数 ,这 比 过 去 认为 这 些 数 就 是 0 值 是 一 个 改进 。 

移 码 形式 的 阶 码 值 为 11111111 时 ,同样 不 能 用 于 表示 规格 化 浮 点 数 ,把 它 与 全 0 值 的 
尾数 结合 起 来 ,用 于 表示 无 穷 大 的 值 。 当 尾数 的 符号 为 正 时 ,表示 正 无 穷 大 的 浮 点 数 , 当 尾 
数 的 符号 为 负 时 ,表示 为 负 无 穷 大 的 浮 点 数 。 

当 阶 码 和 尾数 的 所 有 位 都 是 0 时 ,代表 浮 点 数 的 0 值 ,此 时 的 浮 点 数 有 十 0 和 一 0 两 种 
形式 ,依据 浮 点 数 的 符号 位 是 0 还 是 1 来 加 以 区 别 。 

计算 一 个 IEEE 标准 的 规格 化 浮 点 数 的 实际 值 的 公式 为 

(一 1)5X (1 十 剩余 尾数 ) X 2 人 中 怠 全 127 

此 处 的 S 是 浮 点 数 表 示 中 的 符号 位 .0 正 1 负 ;( 一 1)" 为 1,( 一 1)' 为 一 1。 

(1 十 剩余 尾数 ) 中 的 1 是 隐藏 位 上 的 值 .代表 正 1; 剩 余 尾数 (去 掉 隐 藏 位 后 的 尾数 ) 是 
纯 小 数 部 分 ,二 者 之 和 大 于 等 于 1 并且 比 2 略 小 。 

( 移 码 形式 的 阶 码 值 一 127) 是 实际 的 阶 码 值 .可 正 可 负 , 在 一 126 一 十 127 之 间 。 

这 与 前 面 原理 上 介绍 过 的 计算 一 个 浮 点 数 实际 值 的 公式 有 如 下 对 应 关系 : 

N=MX25 
通过 不 使 用 隐藏 位 、 阶 码 移 128 的 浮 点 数 表示 计算 浮 点 数 实际 值 的 公 
N=(—1)* XMX25!% 

可 以 发 现 , 在 不 使 用 隐藏 位 时 .全 部 尾数 都 在 小 数 点 之 后 , 比 使 用 隐藏 位 的 值 小 了 将 近 
一 半 , 故 此 处 的 阶 码 值 应 该 比 使 用 了 隐藏 位 情况 下 的 阶 码 值 大 1. 所 以 两 种 公式 的 计算 结果 
是 相同 的 ,但 使 用 了 隐藏 位 的 计算 精度 可 以 多 出 1 个 二 进 制 位 。 


4.3.2 泛 点 运算 器 举例 


本 节 将 以 Intel 80287 浮 点 协 处 理 器 为 例 ,来 讨论 浮 点 处 理 器 的 组 成 和 运行 方式 。 
80287 是 Intel 公司 生产 的 ,为 配合 Intel 80286 或 80386 微 处 理 器 处 理 浮 点 数 等 而 设计 的 选 





和 运算 器 吝 件 


购 件 。 在 当前 流行 的 Pentium 微 处 理 机 系统 中 ,性 能 更 高 的 浮 点 运算 器 已 集成 到 CPU 芯 
片 内 。 

1. 80287 的 性 能 及 内 部 结构 

80287 内 部 结构 的 逻辑 框图 如 图 4. 11 所 示 。 
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图 4.11 80287 内 部 结构 的 逻辑 框图 


80287 浮 点 协 处 理 器 的 主要 性 能 如 下 。 

(1) 可 与 80286 或 80386 异步 并 行 工作 。 

(2) 高 性 能 的 80 位 字 长 的 内 部 结构 :有 8 个 80 位 字 长 的 以 堆栈 方式 管理 的 寄存 器 组 。 

(3) 浮 点 数 的 格式 ,完全 符合 IEEE 制定 的 国际 标准 。 

(4) 能 处 理 包括 二 进 制 浮 点 数 . 二进制 整数 和 十 进 制 数 串 3 大 类 共 7 种 数据 。 

(5) 扩展 了 80286 或 80386 的 硬件 指令 ,直接 支持 对 7 种 数据 的 指数 、 对 数 、 三 角 函 数 
和 其 他 一 些 数 学 函数 的 计算 。 

(6) 内 部 的 出 错 管理 功能 。 

80287 是 被 做 在 单个 芯片 之 内 ,并 用 40 条 引线 的 外 壳 封 装 。 它 不 是 一 个 简单 的 浮 点 运 
算 器 本 身 , 而 且 包 括 执行 数据 运算 所 需要 的 全 部 控制 线路 。 

从 图 4. 11 可 以 看 到 ,80287 内 部 有 处 理 浮 点 数 指数 部 分 的 部 件 和 处 理 尾 数 部 分 的 部 
件 , 有 加 速 移 位 操作 的 移 位 器 线路 ,它们 通过 指数 总 线 和 小 数 总 线 与 8 个 80 位 字 长 的 寄存 
器 堆栈 相连 接 。 这 些 寄存 器 可 以 按 堆 栈 方式 工作 :此 时 , 栈 项 被 用 作 累 加 器 ;也 可 以 按 寄 存 
器 的 编号 直接 访问 任意 一 个 寄存 器 。8 个 寄存 器 的 编号 用 0 一 7 表示 ,处 在 栈 顶 的 那个 寄存 
器 的 编号 由 80287 的 状态 字 字 段 TOP 给 出 。 在 80287 的 指令 中 ,用 ST 表示 栈 顶 寄存 器 ， 
并 且 可 以 用 ST(i) 来 访问 其 他 7 个 寄存 器 ,此 时 i 值 可 以 为 1~7 中 的 一 个 值 。i 是 相对 于 
栈 顶 的 一 个 偏 移 量 , 而 不 一 定 是 真正 8 个 寄存 器 的 实际 编号 。 

3 种 浮 点 数 , 阶 码 的 基数 均 为 2, 阶 码 用 移 码 表示 ,尾数 用 原 码 表示 。 浮 点 数 有 32 位 .64 
位 和 80 位 3 种 长 度 。80287 在 从 存储 器 取 数 和 向 存储 器 写 数 时 , 均 用 80 位 的 临时 实数 和 
其 他 数据 类 型 执行 自动 转换 。 


圩 了 汽 
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为 了 保证 指令 的 正确 执行 ,80287 内 还 设置 了 各 为 16 位 字 长 的 3 个 寄存 器 , 即 特征 字 
寄存 器 ,控制 字 寄 存 器 和 状态 字 寄 存 器 。 
2. Pentium 计算 机 中 配置 的 运算 器 
图 4.12 给 出 了 Pentium 计算 机 中 配置 的 运算 器 的 组 成 框图 。 
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图 4.12 Pentium 机 的 运算 器 组 成 示意 图 
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它 有 2 个 32 位 的 完成 整数 运算 的 定点 运算 器 和 一 个 完成 80 位 的 浮 点 数 运算 的 浮 点 运 
算 器 。 仅 从 这 里 考虑 , 它 就 可 以 同时 执行 2 条 对 32 位 整数 运算 的 指令 和 1 条 对 80 位 浮 点 
数 运算 的 指令 的 运算 处 理 。 再 考虑 到 对 整 型 数据 运算 的 指令 和 对 浮 点 数 运算 的 指令 ,又 都 
采用 了 多 级 的 流水 线 处 理 方案 ,事实 上 就 可 以 有 许多 条 指令 同时 处 在 执行 过 程 中 ,其 处 理 能 
力 比 只 用 一 个 不 采用 流水 线 方 案 的 定点 运算 器 的 处 理 能 力 要 增强 许多 倍 。 当 然 , 在 流水 线 
方式 下 的 运行 效率 ,并 不 是 总 能 达到 最 佳 ,还 与 其 他 某 些 因素 有 关 , 等 到 讲解 指令 流水 的 章 
节 再 加 以 说 明 。 


本 章 内 容 小 结 和 学 习 方法 建议 


本 章 主 要 介绍 运算 器 部 件 ,重点 围绕 定点 运算 器 的 功能 、 组 成 与 实现 来 进行 讲解 。 在 讲 
解 通用 知识 的 基础 上 ,还 给 出 了 一 个 很 典型 的 定点 运算 器 芯片 实例 Am2901, 较为 详细 地 介 
绍 其 内 部 组 成 逻辑 框图 、 实 现 的 功能 及 控制 方式 ,用 这 种 芯片 构建 一 个 16 位 字 长 的 运算 器 
部 件 的 方法 。 还 介绍 了 MIPS32 计算 机 运算 器 的 组 成 概况 。 

浮 点 数 的 表示 与 编码 , 浮 点 数 的 运算 规则 应 该 掌握 ,对 浮 点 运算 器 的 组 成 只 是 点 到 为 
止 , 一 般 了 解 即 可 ,不 必 深 究 。 

本 章 给 出 了 一 个 原理 性 的 运算 器 模型 ,强调 学 习 基 础 原理 知识 和 了 解 线路 实现 ,两 个 运 
算 器 实例 ,在 教学 过 程 中 它们 不 是 并 列 关系 , 只 要 学 懂 其 中 的 一 个 即 可 。 例 如 用 4 片 
Am2901 芯片 构成 的 运算 器 部 件 即 可 ,而 把 另外 的 一 个 作为 开阔 眼界 的 背景 资料 来 阅读 , 比 
较 它们 之 间 的 相同 与 差异 之 处 ,并 从 几 个 特例 中 抽取 出 普遍 适用 的 原理 知识 ,包括 一 个 
CPU 系统 由 运算 器 和 控制 器 两 部 分 组 成 ,运算 器 主要 由 寄存 器 组 (REGs)、ALU ,标志 位 寄 
存 器 (Flag) 这 3 个 部 分 (和 其 他 配套 电路 ) 组 成 。 而 出 于 不 同 的 设计 目标 ,不 同 的 使 用 要 求 ， 
可 以 在 不 同 的 系统 中 对 这 3 个 部 分 选用 不 同 的 处 理 方案 。 请 注意 ,把 寄存 器 组 作为 运算 器 
的 一 部 分 ,而 不 是 简单 地 把 ALU 理解 为 完整 运算 器 更 合理 一 些 ,逻辑 关系 更 清晰 ,也 更 容 
易 理 解 。 

Am2901 是 20 世纪 70 年 代 初 的 产品 ,是 定制 的 4 位 的 位 片 结构 的 运算 器 芯片 ,用 作 运 
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算 器 教学 实例 具有 很 好 的 典型 性 。 它 有 2 个 明显 特点 : @ 它 是 比较 完整 的 运算 器 芯片 , 包 
含 寄 存 器 组 (REGs) 和 算术 逻辑 运算 单元 (ALU) 两 部 分 电路 , 读 出 REGs 中 2 个 寄存 器 的 
内 容 .ALU 执行 运算 、 把 运算 结果 写 回 目的 寄存 器 这 3 项 操作 在 一 个 时 钟 周期 完成 ,难以 用 
于 实现 指令 流水 。@ 内 含 一 个 乘 商 寄存 器 Q,ALU 又 支持 左 、 右 移 位 功能 ,很 容易 实现 一 位 
的 硬件 乘除 法 指令 ,清楚 地 反映 那个 时 代 的 集成 电路 和 计算 机 系统 的 发 展 水 平 。 

提醒 同学 们 注意 ,运算 器 是 计算 机 系统 中 最 容易 学 懂 、 有 可 能 深入 理解 的 功能 部 件 , 也 
是 计算 机 控制 器 控制 起 来 最 为 复杂 的 部 分 。 阅 读 描述 CPU 功能 与 组 成 的 ABEL-HDL 或 
VHDL 语言 的 源 程序 就 能 够 清楚 地 看 到 这 种 情况 。 学 生 在 学 习 计 算 机 组 成 原理 课程 的 过 
程 中 容易 遇 到 的 误区 之 一 ,就 是 只 看 到 控制 器 难 学 ,其 实 对 运算 器 部 件 理解 不 透 可 能 是 其 根 
源 之 一 。 在 完整 地 学 习 过 CPU 系统 之 后 会 对 这 一 问题 有 更 清楚 的 认识 。 这 一 小 段 文 字 强 
调 学 好 运算 器 部 件 的 重要 人 性。 
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习题 与 思考 题 
1. 运算 器 的 主要 功能 是 进行 。 
A. 逻辑 运算 B. 算术 运算 
C. 逻辑 运算 和 算术 运算 D. 只 作 加 法 
2. 运算 器 虽 由 许多 部 件 组 成 ,但 核心 部 分 是 
A. 数据 总 线 B. 算术 人 逻辑 运算 单元 
C. 多 路 开关 D. 累加 寄存 器 


3. 定点 运算 器 的 ALU 通常 可 以 完成 对 哪 几 种 数据 的 运算 ? 
4， 定 点 运算 器 一 般 由 哪 几 部 分 组 成 ? 
5. ALU 属于 部 件 。 
A. 运算 器 B. 控制 器 C. 存储 器 D. 寄存 器 
6. 简 述 书 中 给 出 的 MIPS 计算 机 的 运算 器 部 件 的 功能 和 组 成 。 
7. 解释 定点 运算 器 的 功能 和 组 成 逻辑 部 件 。 以 Am2901 芯片 为 实例 ,来 介绍 定点 运算 
器 的 有 关 知 识 ,你 的 认可 程度 如 何 ? 





8. 在 定点 二 进 制 运算 器 中 ,减法 运算 一 般 通 过 来 实现 。 
A. 原 码 运算 的 二 进 制 减法 器 B. 补 码 运算 的 二 进 制 减法 器 
C. 补 码 运算 的 十 进 制 加 法 器 D. 补 码 运算 的 二 进 制 加 法 器 
9. 加 法 器 采用 并 行进 位 的 目的 是 
A. 提高 加 法 器 的 速度 B. 快速 传递 进位 信号 
C. 优化 加 法 器 结构 D. 增强 加 法 器 功能 
10. 组 成 一 个 运算 器 需要 多 个 部 件 .但 下 面 所 列 不 是 组 成 运算 器 的 部 件 。 
A. 状态 寄存 器 。 B. 数据 总 线 CG; ALU D. 地 址 寄存 器 


11. 在 运算 器 部 件 中 ,为 什么 要 设置 多 个 累加 器 ? 累加 器 的 数目 多 少 对 计算 机 的 性 能 
有 什么 影响 吗 ? 

12. 浮 点 运算 器 由 哪 几 部 分 组 成 ? 

13. 某 计算 机 有 一 个 标志 寄存 器 ,其 中 有 进位 / 借 位 标志 CF 、 零 标志 ZF ,符号 标志 SF 
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和 溢出 标志 OF ,条 件 转移 指令 bgt( 无 符号 整数 比较 大 于 时 转移 ) 的 转移 条 件 是 
A. CF+OF=1  B. SF 十 ZF=1 C. CF+ZF=1 D. CF+SF=1 

14. 浮 点 运算 器 的 组 成 比 定点 运算 器 组 成 更 复杂 ,主要 表现 在 哪些 方面 ? 原理 上 讲 , 浮 
点 运算 器 由 两 个 相互 关联 的 定点 运算 器 (分 别处 理 整数 和 纯 小 数 ) 组 成 ,有 点 道理 吗 ? 

15. 假定 X 王 0.0110011X22 ,Y 王 0.1101101X2-2( 此 处 的 数 均 为 二 进 制 ) ,再 不 使 用 
隐藏 位 的 情况 下 ,完成 下 列 题目 。 

(1) 浮 点 数 阶 码 用 4 位 移 码 .尾数 用 8 位 原 码 表示 ( 含 符号 位 ), 写 出 该 浮 点 数 能 表示 的 
绝对 值 最 大 、 最 小 的 ( 正 数 和 负数 ) 数 值 。 

(2) 写 出 XY 的 正确 的 浮 点 数 表示 (注意 ,此 处 预 设 了 个 小 陷阱 )。 

(3) 计算 XX 十 Y。 

(4) 计算 XXY。 

16. 假定 在 一 个 8 位 字 长 的 计算 机 中 运行 如 下 的 类 C 程序 段 : 

















unsigned int =134; 
unsigned int y=246; 
int mmx; 
int my; 
unsigned int zl=x-y; 
unsigned int zxty; 
int kl=mn; 
int km n; 
若 编 译 器 编译 时 将 8 个 8 位 寄存 器 Ri 一 Rs 分 别 分 配给 变量 ywm、n、z1、z2、k1、kz。 
请 回答 下 列 问题 。( 提 示 : 带 符号 整数 用 补 码 表示 ) 
(1) 执行 上 述 程序 段 后 ,寄存 器 Ri Rs 和 Rs 的 内 容 分 别 是 什么 ?”( 用 十 六 进 制 表示 ) 
(2) 执行 上 述 程 序 段 后 .变量 m 和 k1 的 值 分 别 是 多 少 ?〈 用 十 进 制 表示 ) 
(3) 上 述 程序 段 涉及 带 符号 整数 加 / 减 , 无 符号 整数 加 / 减 运算 ,这 4 种 运算 能 否 利用 同 
一 个 加 法 器 及 辅助 电路 实现 ? 简 述 理由 。 
(4) 计算 机 内 部 如 何 判断 带 符号 整数 加 / 减 运算 的 结果 是 否 发 生 江 出 ” 上述 程 序 段 中 ， 
哪些 带 符号 整数 运算 语句 的 执行 结果 会 发 生 溢 出 ? 
17. 一 个 C 语 言 程序 在 一 台 32 位 机 器 上 运行 。 程 序 中 定义 了 3 个 变量 +、y 和 <, 其 中 
工 和 x 为 int 型 ,y 为 short 型 。 当 z= 二 127,y 二 一 9 时 ,执行 赋值 语句 < 二 x 十 y 后 ,Xx、y 和 x 
的 值 分 别 是 
A. z=0000007FH. y=FFF9H. z=00000076H 
B. x=0000007FH. y=FFF9H. z=FFFF0076H 
C. x=0000007FH, y=FFF7H, z=FFFF0076H 
D. z=0000007FH. y=FFF7H. <==00000076H 
18. 浮 点 数 加 减 运算 过 程 一 般 包 括 对 阶 、. 尾 数 运算 ,规格 化 .输入 和 判 溢出 等 步骤。 设 
浮 点 数 的 阶 码 和 尾数 均 用 补 码 表示 , 且 位 数 分 别 为 5 位 和 7 位 ( 均 含 2 位 符号 位 ) 。 若 有 两 
个 数 X 一 2 X29/32,Y 二 2*X5/8, 则 用 浮 点 加 法 计算 X 十 Y 的 最 终结 果 是 
A. 00111 1100010 B. 00111 0100010 
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C. 01000 0010001 D. 发 生 溢出 
19. 假定 变量 i、f 和 4 的 数据 类 型 分 别 为 int、float 和 double(int 用 补 码 表 示 ,float 和 
double 分 别 用 IEEE 754 单 精度 和 双 精 度 浮 点 数据 格式 表示 ), 已 知 ;一 785, /= 二 1. 5678e’， 
d 二 1.5 ew”。 若 在 32 位 机 器 中 执行 下 列 关系 表达 式 , 则 结果 为 " 真 ” 的 是 
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(1)i== (int) (float)i (1 )f== (float) (in0)f 

(1)f== (float) (double)f (N)(d+f)—d== 

A. 仅 工 和 工 B. 仅 工 和 焉 C. 仅 开 和 亚 D. 仅 卫 和 TV 
20. 下 列 选项 中 ,描述 浮 点 数 操作 速度 指标 的 是 

A. MIPS B. CPI CG PC D. MFLOPS 


21. float 型 数据 通常 用 IEEE 754 单 精 度 浮 点 数 格式 表示 。 若 编译 器 将 float 型 变量 x 
分 配 在 一 个 32 位 浮 点 寄存 器 FR1 中 , 且 x 二 一 8.25, 则 FR1 的 内 容 是 。 
A. Cl104 0000H B. C242 0000H C.C184 0000H D. C1C2 0000H 





千本 
指令 系统 和 汇编 语言 程序 设计 


指令 是 指示 计算 机 执行 某 项 运算 或 操作 功能 的 命令 。 一 台 计算 机 使 用 的 全 部 指令 组 成 
这 台 计算 机 的 指令 系统 。 指 令 系 统 处 于 硬件 和 软件 的 交界 面 上 , 它 被 划分 为 精简 指令 系统 
(RISC) 和 复杂 指令 系统 (CISC) 两 大 类 。 从 用 户 的 角度 看 ,指令 用 于 编写 程序 ,是 用 户 使 用 
与 控制 计算 机 运行 的 最 小 功能 单位 ;从 计算 机 的 组 成 和 功能 来 看 ,计算 机 硬件 系统 是 用 于 实 
现 每 条 指令 功能 的 实际 设备 ,因此 硬件 系统 只 能 直接 识别 和 运行 由 机 器 指令 构成 的 程序 , 指 
令 系统 直接 与 计算 机 的 运行 性 能 和 硬件 结构 密切 相关 ,是 设计 一 台 计 算 机 的 起 始点 和 基本 
依据 。 

本 章 重 点 讲授 计算 机 的 指令 ,指令 系统 和 汇编 语言 程序 设计 这 3 项 内 容 。 


5.1 指令 格式 和 指令 系统 概述 


5.1.1 指令 的 定义 和 指令 格式 


计算 机 系统 由 硬件 和 软件 两 个 子 系统 组 成 。 硬 件 是 指 构成 计算 机 的 中 央 处 理 机 、 主 存 
储 器 、 输 入 输出 设备 等 物理 装置 。 软 件 则 指 由 软件 厂家 为 方便 用 户 使 用 计算 机 而 提供 的 系 
统 软 件 和 用 户 用 于 完成 自己 的 特定 事务 和 信息 处 理 任务 而 设计 的 用 户 软件 。 计 算 机 硬件 能 
直接 识别 和 运行 的 软件 程序 通常 由 该 计算 机 的 指令 代码 序列 组 成 。 

1. 指令 的 定义 

用 于 组 成 计算 机 程序 指示 计算 机 硬件 执行 某 项 运算 或 操作 功能 的 命令 叫 作 指 令 , 在 计 
算 机 内 部 它 是 用 一 定 长 度 的 二 进 制 位 串 来 表示 的 。 一 台 计 算 机 支持 (或 称 使 用 ) 的 全 部 指令 
构成 该 机 的 指令 系统 。 指 令 系 统 对 计算 机 用 户 和 计算 机 厂家 都 有 着 非常 重要 的 影响 。 指 令 
是 设计 计算 机 程序 的 最 小 功能 单位 ,计算 机 厂家 需要 在 计算 机 硬件 系统 中 实现 每 一 条 指令 
的 功能 ,用 指令 设计 各 种 系统 软件 ,指令 系统 直接 与 计算 机 系统 的 运行 性 能 、 硬 件 结构 的 复 
杂 程 度 等 密切 相关 , 它 是 设计 一 台 计 算 机 的 起 始点 和 基本 依据 。 

早期 的 计算 机 ,从 简化 计算 机 硬件 结构 、 降 低 成 本 考虑 ,指令 系统 都 比较 简单 ,指令 条 数 
少 、 运 算 功 能 弱 , 能 处 理 的 数据 只 是 定点 小 数 ,使 用 相当 困难 。 到 了 20 世纪 六 七 十 年 代 , 随 
着 集成 电路 和 超大 规模 集成 电路 的 出 现 与 发 展 ,计算 机 硬件 成 本 直线 下 降 , 相 应 的 软件 成 本 
所 占 比 例 迅速 增加 ,计算 机 的 指令 系统 日 渐变 得 更 加 复杂 和 完备 ,指令 条 数 多 达 300 一 500 
条 , 寻 址 方式 也 多 达 十 几 种 ,能 直接 处 理 的 数据 类 型 更 多 ,构成 了 复杂 指令 系统 的 计算 机 。 
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在 1975 年 前 后 ,人 们 又 发 现 , 一 味 追 求 指令 系统 的 复杂 和 完备 程度 ,并 不 是 提高 计算 机 性 能 
的 唯一 途径 。 在 CISC 计算 机 中 ,有 80% 的 功能 更 强 、 实 现 起 来 更 为 复杂 的 指令 却 较 少 被 使 
用 ,在 程序 运行 的 过 程 中 只 占 到 20% 的 时 间 . 有 80% 的 程序 运行 时 间 使 用 的 是 另外 20% 的 
功能 简单 .实现 容易 的 指令 。 据 此 提出 了 简化 指令 系统 的 计算 机 的 概念 并 予以 实现 ,只 选用 
几 种 简单 的 寻 址 方式 和 最 常用 的 几 十 条 指令 ,充分 考虑 了 超大 规模 集成 电路 设计 、 制 造 中 的 
有 关 问 题 ,吸收 当前 软件 研究 的 各 项 成 果 , 从 硬 ` 软 件 结合 的 角度 解决 了 许多 矛盾 ,设计 制造 
出 运行 性 能 更 高 的 RISC 计算 机 系统 。 它 虽然 有 明显 的 优势 ,但 不 能 完全 取代 CISC 计算 机 
系统 ,考虑 到 此 前 已 有 的 大 量 软 件 资源 是 应 用 CISC 结构 的 指令 系统 实现 的 ,CISC 计算 机 
仍 有 其 存在 的 理由 。 

要 确定 一 台 计 算 机 的 指令 系统 并 评价 其 优 劣 ,通常 应 从 如 下 4 个 方面 考虑 。 

(1) 指令 系统 的 完备 性 ,常用 指令 齐全 ,编程 方便 。 

(2) 指令 系统 的 高 效 性 ,程序 占 内 存 空间 少 ,运行 速度 快 。 

(3) 指令 系统 的 规整 性 ,指令 和 数据 使 用 规则 统一 简单 ,易学 易 记 。 

(4) 指令 系统 的 兼容 性 ,同一 系列 的 低档 计算 机 的 程序 能 在 新 的 高 档 机 上 直接 运行 。 

要 完全 同时 满足 上 述 标 准 是 困难 的 ,但 它 可 以 指导 我 们 设计 出 更 加 合理 的 指令 系统 。 
设计 指令 系统 的 核心 问题 是 选 定 指令 的 功能 和 格式 。 指 令 的 格式 与 计算 机 的 字 长 ,期望 的 
存储 器 容量 和 读 写 方式 ,支持 的 数据 类 型 .计算 机 硬件 结构 的 复杂 程度 和 追求 的 运算 性 能 等 
有 关 , 这 些 内 容 中 的 某 些 部 分 超出 了 我 们 的 教学 内 容 范 围 , 请 有 兴趣 者 参阅 其 他 资料 。 

2. 指令 格式 

通常 情况 下 ,一 条 指令 要 由 如 图 5.1 所 示 的 两 部 分 内 容 组 成 。 

_ 第 一 部 分 是 指令 的 操作 码 。 操作 码 用 于 指明 本 条 指令 撤 作 疝 入 作 才 地 下 
的 运算 和 操作 功能 ,例如 ,是 算术 加 运算 、 减 运算 还 是 多 辑 1 
与 运算 .或 运算 功能 ,是 否 是 读 、 写 内 存 或 读 . 写 外 设 操作 功 S 
能 ,是 否 是 程序 转移 和 子 程序 调用 或 返回 操作 功能 等 。 计 算 机 需要 为 每 条 指令 分 配 一 个 确 
定 的 操作 码 。 

第 二 部 分 是 指令 的 操作 数 地 址 。 用 于 给 出 被 操作 的 信息 (指令 或 数据 ) 的 地 址 ,包括 参 
加 运算 的 一 个 或 多 个 操作 数 所 在 的 地 址 ,运算 结果 的 保存 地 址 ,程序 的 转移 地 址 ,被 调用 的 
子 程序 的 入 口 地 址 等 。 

在 一 条 指令 中 ,如 何 安排 指令 字 的 长 度 , 即 使 用 多 少 个 二 进 制 位 (bit) 表 示 一 条 指令 ,又 
如 何 分 配 指令 字 中 这 两 部 分 所 占用 的 位 数 (长 度 ) ,如 何 安排 操作 数 的 个 数 , 如 何 表示 和 使 用 
一 个 操作 数 的 地 址 ( 寻 址 方式 ) ,是 要 认真 对 待 、 精 心 设计 的 重要 问题 。 寻 址 方式 将 单独 放 在 
5. 2 节 讲 解 ,其 余 内 容 在 本 节 的 下 面部 分 分 别 介 绍 。 


5.1.2 操作 码 的 组 织 与 编码 


计算 机 的 字 长 是 由 选用 的 数据 的 类 型 及 其 表示 所 用 的 二 进 制 位 数 决定 的 ,通常 是 2、4、 
8 个 字 节 。 指 令 字 的 长 度 , 多 数 情况 下 就 确定 为 计算 机 的 字 长 , 即 一 条 指令 占用 计算 机 的 一 
个 内 存 字 ,但 并 不 强制 要 求 所 有 指令 的 字 长 都 相同 ,以 使 提高 计算 机 资源 利用 率 。 例 如 ,在 
一 个 内 存 字 中 ,可 以 考虑 存放 几 条 很 短 的 指令 ;长 的 指令 也 可 能 占用 多 个 内 存 字 .例如 在 字 
长 较 短 的 计算 机 系统 中 , 某 些 指令 需要 选用 双 字 指令 格式 ,保存 这 样 的 一 条 指令 就 要 使 用 两 
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个 内 存 字 。 

从 对 指令 操作 码 的 组 织 与 编码 所 选用 的 方案 分 类 ,可 以 区 分 出 如 下 2 种 处 理 情况 。 这 
里 只 是 简单 介绍 一 些 基本 概念 ,更 详细 的 内 容 到 5. 3 节 会 清楚 地 看 到 。 

(1) 定 长 的 操作 码 的 组 织 方案 。 在 当前 多 数 的 计算 机 中 ,一 般 都 在 指令 字 的 最 高 位 部 
分 分 配 固定 的 若干 位 ( 定 长 ) 用 于 表示 操作 码 , 例 如 8 位 , 它 有 256 个 编码 状态 , 故 最 多 可 以 
表示 256 条 指令 。 这 对 于 简化 计算 机 硬件 设计 ,提高 指令 译 码 和 识别 速度 很 有 利 。 当 计算 
机 字 长 为 32 位 或 更 长 时 ,这 是 常规 正统 用 法 ,如 IBM370 机 、VAX-11 机 。 我 们 设计 实现 用 
于 硬件 课程 教学 的 16 位 字 长 的 教学 计算 机 系统 也 选用 定 长 的 8 位 指令 操作 码 。 

(2) 变 长 的 操作 码 的 组 织 方案 。 当 计算 机 的 字 长 与 指令 长 度 为 16 位 或 8 位 时 ,单独 为 操 
作 码 划分 出 固定 的 多 位 后 , 留 给 用 于 表示 操作 数 地 址 的 位 数 就 会 严重 不 足 。 为 此 不 得 不 对 一 
个 指令 字 的 每 一 个 二 进 制 位 的 使 用 精打细算 ,使 一 些 位 (bit) 在 不 同 的 指令 中 有 不 同 的 作用 。 
例如 ,在 一 些 指令 中 ,这 些 位 用 作 操 作 码 ;而 在 另外 一 些 指令 中 ,这 些 位 又 被 用 作 操 作 数 的 地 
址 。 则 不 同 指令 的 操作 码 长 度 就 会 不 同 , 即 尽量 为 那些 最 常用 (程序 中 使 用 频率 高 ) .用 于 表示 
操作 数 地 址 的 位 数 要 求 又 较 多 的 指令 ,适当 少 分 配 几 位 操作 码 ( 当 然 能 表示 的 指令 条 数 也 就 
少 ) ;而 对 那些 表示 操作 数 地 址 的 位 数 要 求 较 少 的 指令 多 分 配 几 位 操作 码 ; 对 那些 无 操作 数 的 
指令 ,整个 指令 字 的 全 部 位 都 用 作 操 作 码 ,力争 在 比较 短 的 一 个 指令 字 中 , 既 能 表示 出 比较 多 
的 指令 条 数 ,又 能 尽量 满足 给 出 相应 的 操作 数 地 址 的 要 求 ,如 PDP-11 计算 机 就 选用 这 种 方案 。 
我 们 设计 实现 的 用 于 硬件 课程 教学 的 8 位 字 长 的 计算 机 就 选用 变 长 的 操作 码 。 


5.1.3 有 关 操 作 数 的 类 型 .个 数 、 来 源 、 去 向 和 地 址 安排 


在 计算 机 指令 中 ,可 以 直接 使 用 的 基本 数据 类 型 通常 包括 逻辑 类 型 (bit) ,字符 和 字符 
串 类 型 .整数 类 型 (integer)、 浮 点 数 类 型 (floating) 等 ,需要 结合 指令 的 操作 码 来 判断 数据 类 
型 并 完成 相应 的 运算 处 理 。 使 用 这 几 个 基本 的 数据 类 型 还 能 构造 出 高 级 语言 中 的 更 为 复杂 
的 复合 数据 类 型 ,这 些 复合 数据 类 型 不 能 出 现在 基本 的 机 器 指令 中 。 

不 同 的 指令 使 用 不 同 数目 \ 不 同 来 源 去 向 .不 同 用 法 的 操作 数 ,必须 把 它们 统一 起 来 ,并 
安排 在 指令 字 的 数据 地 址 字段 。 

从 用 到 的 操作 数 个 数 区 分 ,可 能 有 如 下 4 种 情况 。 

(1) 无 操作 数 指令 。 有 的 指令 不 涉及 操作 数 ,或 使 用 约定 的 某 个 ( 些 ) 操 作 数 , 既 已 约定 
则 没有 必要 再 在 指令 中 加 以 表示 , 称 这 类 指令 为 无 操作 数 指令 。 它 仅 有 操作 码 部 分 ,例如 停 
机 指令 、 空 操作 指令 、 关 中 断 指 令 、 堆 栈 结构 的 计算 机 系统 中 对 堆栈 中 数据 运算 的 指令 等 。 

(2) 单 操作 数 指令 。 有 些 指令 只 用 一 个 操作 数 ,必须 在 指令 中 指明 其 地 址 ,如 一 个 寄存 
器 内 容 增 1 或 减 1 运算 的 指令 ;或 还 使 用 约定 的 某 个 操作 数 , 既 已 约定 则 无 须 再 在 指令 中 加 
以 表示 ,例如 完成 从 (向 ) 外 设 读 ( 写 ) 数 据 的 指令 ,就 可 以 只 在 指令 中 指明 该 外 设 地 址 ,而 把 
接收 (送出 ) 数 据 的 通用 寄存 器 约定 下 来 。 此 外 ,在 短 字 长 的 .采用 单个 累加 器 的 计算 机 中 ， 
已 约定 目的 操作 数 ( 如 被 加 数 、 被 减 数 等 ) 和 保存 计算 结果 都 使 用 唯一 的 那个 累加 器 ,指令 中 
只 需 指 定 另 外 一 个 源 操作 数 即 可 。 称 上 述 这 些 指令 为 单 操作 数 指令 。 

(3) 双 操 作 数 指令 。 对 于 常用 的 算术 和 逻辑 运算 指令 ,往往 要 求 使 用 两 个 操作 数 , 这 两 
个 操作 数 往往 保存 在 两 个 寄存 器 中 , 需 分 别 给 出 目的 寄存 器 和 源 寄存 器 的 编号 .其 中 目的 寄 
存 器 还 用 于 保存 本 次 的 运算 结果 。 在 寄存 器 与 主 存储 器 之 间 完成 数据 传送 的 指令 ,也 需要 
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给 出 寄存 器 编号 和 主 存储 器 地 址 。 称 这 类 指令 为 双 操作 数 指令 。 

(4) 多 操作 数 指令 。 另 外 一 些 指令 可 能 使 用 多 个 操作 数 , 如 3 个 操作 数 ,其 中 两 个 操作 
数 地 址 分 别 给 出 两 个 源 操作 数 的 地 址 ,第 三 个 操作 数 地 址 是 用 于 给 出 保存 本 次 运算 结果 的 
目的 操作 数 地 址 ,可 以 称 这 类 指令 为 三 操作 数 指令 ;在 有 些 性 能 更 高 的 计算 机 (甚至 PC 机 ) 
中 ,还 有 在 指令 中 使 用 更 多 个 操作 数 地 址 的 指令 ,用 于 完成 对 一 批 数据 的 处 理 过 程 ,如 字符 
串 复 制 指令 ,向量 ,矩阵 运算 指令 等 , 称 这 类 指令 为 多 操作 数 指令 。 

上 述 4 种 情况 中 的 前 3 种 ,由 于 其 具有 指令 字 长 可 以 相对 较 得、 执行 速度 较 高 .计算 机 
硬件 结构 可 以 相对 简单 等 优点 ,在 各 种 不 同类 型 的 计算 机 中 被 广泛 应 用 ;相对 而 言 ,最 后 一 
种 更 多 地 用 在 字 长 较 长 的 大 中 型 计算 机 中 。 

请 注意 ,指令 的 操作 数 地 址 字段 有 时 也 用 于 给 出 指令 的 地 址 ,例如 ,转移 指令 的 转移 目 
标 地 址 、. 子 程序 的 入口 地 址 等 。 

在 设计 实现 实际 的 指令 系统 时 ,还 有 一 些 问 题 需 要 处 理 , 暂 不 袭 述 。 

从 操作 数 的 来 源 .去 向 及 其 在 指令 字 中 的 地 址 安排 考虑 ,有 多 种 情况 。 

这 里 说 的 操作 数 的 来 源 、 去 向 ,是 指 表示 在 指令 中 操作 数 要 从 哪里 读 来 , 写 向 哪里 去 。 

下 面 讨 论 操 作 数 的 来 源 、 去 处 和 地 址 安排 。 

可 以 把 指令 中 的 操作 数 的 来 源 、 去 向 归纳 为 如 下 4 种 主要 情况 。 

(1) 操作 数 的 第 一 个 来 源 、 去 向 ,可 以 是 CPU 内 部 的 通用 寄存 器 ,此 时 应 在 指令 字 中 给 
出 用 到 的 寄存 器 编号 (寄存 器 名 )。 通 用 寄存 器 的 数量 一 般 为 几 个 、 十 几 个 ,一 二 百 个 , 故 在 
指令 字 中 须 为 其 分 配 2、3、4、5 或 更 多 一 点 的 位 数 来 指明 一 个 寄存 器 。 该 寄存 器 中 的 内 容 ， 
可 以 是 指令 运算 用 到 的 数据 ,也 可 能 用 作 一 个 操作 数 或 者 指令 的 地 址 ,或 计算 主 存储 器 地 址 
的 相关 信息 。 

(2) 操作 数 第 二 个 来 源 、 去 向 ,是 外 围 设备 (接口 ) 中 的 一 个 寄存 器 。 通 常用 设备 编号 、 
或 设备 人 出 端口 地 址 .或 设备 映像 地 址 (与 内 存储 器 地 址 统一 编 址 的 一 个 设备 地 址 编号 ) 来 
表示 。 设 备 编号 或 设备 人 出 端口 地 址 用 的 位 数 不 会 太 多 ,通常 可 以 在 第 一 个 指令 字 中 直接 
给 出 。 设 备 映像 地 址 与 一 个 内 存单 元 地 址 的 处 理 办 法 类 同 ,到 5. 2 节 有 具体 说 明 。 

(3) 操作 数 的 第 三 个 来 源 、 去 向 ,是 内 存储 器 的 一 个 存储 单元 ,此 时 应 在 指令 字 中 给 出 
该 存储 单元 的 地 址 。 由 于 许多 计算 机 用 到 的 内 存 地 址 的 位 数 就 是 一 个 机 器 字 的 长 度 ,要 在 
一 个 指令 字 中 既 给 出 操作 码 \ 有 关 寄 存 器 编号 等 信息 ,又 直接 给 出 这 一 内 存 地 址 是 困难 的 ， 
再 加 上 还 有 采用 多 种 不 同方 式 读 写 内 存 的 需求 ,这 就 需要 找到 解决 这 些 问 题 的 完整 方案 。 
将 单独 在 5. 2 节 来 详细 说 明 具 体 解决 方案 。 

(4) 操作 数 的 第 四 个 来 源 是 指令 字 中 的 某 个 字段 的 内 容 。 它 可 能 就 是 一 个 运算 要 用 到 
的 数据 ,或 适当 处 理 后 形成 用 于 数据 运算 、 存 储 器 地 址 计算 的 一 个 数据 。 


5.1.4 指令 的 分 类 


一 台 计 算 机 的 指令 系统 往往 由 几 十 条 到 几 百 条 指令 组 成 。 可 以 从 不 同 的 角度 对 这 些 指 
令 进行 分 类 。 如 前 一 节 讲 的 就 是 按 指令 中 使 用 的 操作 数 个 数 来 分 类 的 ,但 更 常用 的 还 是 按 
指令 所 完成 的 功能 进行 分 类 ,由 于 不 同人 对 指令 功能 划分 的 标准 并 不 完全 相同 ,其 分 类 结果 
也 就 会 有 所 差异 ,我 们 给 出 如 下 分 类 的 例子 。 

(1) 算术 与 逻辑 运算 类 指令 是 每 台 计 算 机 都 必须 具有 的 指令 , 它 通常 完成 对 一 或 两 个 
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数据 的 算术 运算 或 逻辑 运算 功能 。 不同 档 次 ,不 同性 能 的 计算 机 所 能 加 工 、 运 算 的 数据 类 型 
(整数 、 浮 点 数 .十 进 制 数 等 ) 和 支持 的 运算 功能 (加 ' 减 , 乘 、. 除 ` 变 符号 等 ) 的 完备 程度 可 以 有 
所 差异 ,但 一 般 都 必须 给 出 算术 与 逻辑 运算 的 结果 ,以 及 结果 的 有 关 特 征 。 

(2) 移 位 操作 类 指令 包括 算术 移 位 .逻辑 移 位 、 循 环 移 位 3 种 ,用 于 把 指定 的 一 个 操作 
数 左 移 或 右 移 一 (多 ) 位 。 从 实用 的 角度 ,算术 移 位 指令 常 只 使 用 右 移 功能 ,对 补 码 表示 的 一 
个 二 进 制 数 , 最 高 位 上 的 符号 位 不 变 , 再 把 符号 位 和 数据 位 同时 右 移 一 位 ;逻辑 左 ( 右 ) 移 位 
通常 是 在 最 低 (高 ) 的 一 位 移入 0 值 ,把 最 高 ( 低 ) 一 位 移出 的 值 送 到 进位 触发 器 C 中 ;循环 
移 位 则 是 把 进位 触发 器 C 和 一 个 被 移 位 的 数据 首尾 衔接 起 来 一 同 实现 左 或 右 移 位 操作 。 

(3) 数据 传送 类 指令 用 于 实现 通用 寄存 器 之 间 、 通 用 寄存 器 与 内 存储 器 存储 单元 之 间 
(通常 也 可 以 单独 称 其 为 存储 器 读 写 指令 ) ,内 存储 器 不 同 的 存储 单元 之 间 、 通 用 寄存 器 与 外 
围 设备 (接口 ) 之 间 ( 有 些 场合 也 可 以 单独 划分 为 输入 /输出 指令 ) 的 数据 传送 功能 。 从 内 存 
储 器 和 外 围 设备 (接口 ) 操 作 性 质 的 不 同 , 又 可 以 区 分 为 读 和 写 操作 两 种 , 它 指明 数据 传送 的 
方向 ,数据 从 内 存 或 外 围 设备 传送 到 CPU ,或 者 数据 从 CPU 传送 到 内 存 或 外 围 设 备 。 

(4) 转移 类 指令 用 于 解决 变动 程序 中 指令 执行 次 序 ( 程 序 执行 流程 ) 的 需求 。 转 移 指令 
是 一 种 改变 程序 中 指令 执行 次 序 的 指令 。 程 序 中 的 指令 ,大 部 分 是 按 指 令 排 列 的 自然 次 序 
顺序 执行 ,但 有 时 候 又 要 求 不 执行 邻接 的 下 一 条 指令 ,而 是 转移 到 另 一 段 程序 入 口 处 开始 执 
行 , 此 时 就 会 用 到 一 条 转移 指令 。 转 移 指令 又 被 区 分 为 无 条 件 转移 和 条 件 转移 两 类 。 二 者 
的 相同 之 处 是 都 必须 在 指令 中 给 出 转移 地 址 。 不 同 之 处 是 ,条 件 转移 指令 还 必须 在 指令 中 
给 出 判断 是 否 执行 转移 所 依据 的 条 件 , 仅 在 条 件 为 真 时 才 执行 转移 ,否则 顺序 执行 ;而 无 条 
件 转移 指令 一 定 执行 转移 。 

(5) 子 程序 调用 指令 与 返回 指令 可 以 被 理解 为 一 种 特定 的 转移 指令 。 二 者 要 配合 使 
用 ,通过 子 程序 调用 指令 ,使 一 段 被 称 为 子 程序 的 特定 程序 段 投入 运行 ,而 该 程序 段 的 最 后 
一 条 指令 ,一 定 是 一 条 子 程序 返回 指令 , 它 会 在 子 程序 运行 结束 后 ,确保 转移 回 到 主 程序 中 
排 在 子 程序 调用 指令 之 后 的 那 条 指令 处 接着 执行 。 而 一 般 的 转移 指令 ,并 不 涉及 再 返回 来 
的 问题 。 再 深入 一 步 讲 , 子 程序 又 可 以 被 分 为 用 户 自 己 编写 的 子 程序 和 软件 系统 提供 的 子 
程序 两 大 类 ,这 后 一 部 分 又 被 称 为 访问 系统 程序 ( 访 管 ) 指 令 、 陶 阱 (TRAP) 指 令 。 

(6) 特权 指令 是 指 仅 用 于 操作 系统 或 其 他 系统 软件 的 指令 ,为 确保 系统 与 数据 安全 起 
见 ,这 一 类 指令 不 提供 给 用 户 使 用 。 这 一 类 指令 主要 用 于 管理 与 分 配 系 统 资源 ,包括 改变 系 
统 的 工作 方式 ,完成 任务 的 创建 或 切换 ,变更 管理 存储 器 用 的 段 表 和 页 表 中 的 内 容 等 。 特 权 
指令 对 多 用 户 或 多 任务 系统 是 必要 的 。 

(7) 其 他 指令 ,如 动态 停机 指令 、 空 操作 指令 、 置 条 件 码 指令 、 开 中 断 指令 、 关 中 断 指令 、 
堆栈 操作 指令 等 ,用 于 完成 某 些 特定 的 处 理 功能 。 


5.1.5 指令 周期 及 其 对 计算 机 性 能 和 硬件 结构 的 影响 


本 节 内 容 要 到 第 6 章 控制 器 部 件 的 相关 章节 详细 讲解 , 先 在 这 里 简单 介绍 有 关 指 令 周 
期 和 指令 执行 步骤 两 个 基本 概念 。 

通常 把 执行 一 条 指令 所 用 的 时 间 叫 作 指 令 周 期 。 一 个 指令 周期 往往 要 包含 几 个 执行 步 
又 ,就 是 说 ,一 条 指令 的 完整 功能 需要 依次 经 过 这 几 个 步骤 的 操作 才能 完成 。 例 如 在 MIPS 
计算 机 系统 中 ,一 个 指令 周期 可 能 包括 读 取 指 令 、 指 令 译 码 和 读 寄存 器 组 .ALU 执行 运算 、 
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读 写 内 存 或 接口 数据 写 回 寄存 器 组 这 5 个 步骤 ,如 图 5.2 所 示 。 
[ 访 取 指令 | 指令 译 码 | ALU 执 行 | 内 存 读 写 | 数据 写 回 | 

















图 5.2 指令 的 5 个 执行 步骤 


所 有 指令 都 是 在 取 指 一 译 码 一 执行 (包括 第 (3) 一 (5) 步 ) 的 循环 中 完成 的 。 

(1) 读 取 指令 是 每 一 条 指令 必须 首先 完成 的 ,所 完成 的 功能 对 所 有 指令 都 相同 。 

(2) 指令 译 码 完成 的 功能 对 多 数 的 指令 是 类 似 的 ,例如 判断 指令 类 型 . 读 寄存 器 组 等 。 

(3) ALU 执行 运算 所 完成 的 是 数据 计算 或 者 地 址 计算 功能 ,对 不 同 指令 会 有 所 差别 。 

(4) 读 写 内 存 或 接口 仅 出 现在 读 写 内 存 或 者 读 写 接口 指令 的 执行 过 程 中 。 

(5) 数据 写 回 完成 把 ALU 的 计算 结果 或 从 内 存 、 接 口 读 来 的 数据 写 入 寄存 器 组 。 

需要 注意 ,这 5 个 执行 步骤 的 前 后 次 序 是 有 内 在 联系 的 ,每 一 步 都 会 作为 下 一 步 运行 的 
前 提 , 不 能 随意 变动 。 第 1 步 的 读 取 指 令 是 后 续 各 步骤 运行 的 前 提 , 只 有 在 取得 指令 之 后 才 
能 够 知晓 接 下 来 应 该 完成 的 是 什么 运算 处 理 功能 、 使 用 哪 几 个 数据 ,需要 怎样 完成 运算 处 理 
等 ;在 第 1 步 中 还 可 以 计算 出 下 条 相 邻 指令 所 在 的 存储 单元 地 址 。 

在 得 到 指令 内 容 之 后 ,第 2 步 就 可 以 检查 、 判 别 指令 类 型 .指令 操作 码 等 。 这 主要 体现 
为 对 指令 的 操作 码 字 段 内 容 进 行 译 码 ; 大 部 分 指令 执行 过 程 中 会 用 到 寄存 器 组 内 的 1 一 2 个 
寄存 器 的 内 容 , 要 在 此 步 又 把 它们 读 出 来 ,作为 下 一 步 ALU 执行 计算 的 原始 数据 。 

第 3 步 是 ALU 执行 运算 ,对 于 寄存 器 之 间 的 数据 运算 等 指令 ,完成 的 是 对 数据 的 运 
算 、 比 较 、 移 位 等 操作 。 运 算 结果 通常 需要 写 回 到 寄存 器 组 的 一 个 寄存 器 中 ,在 这 里 已 把 写 
回 操作 移 到 更 后 面 的 一 个 步 又 中 去 完成 ,在 本 步骤 将 把 计算 结果 和 暂 存 到 一 个 专用 寄存 器 中 。 
对 存储 器 读 写 指令 ,ALU 完成 的 是 计算 数据 在 存储 器 中 的 单元 地 址 ,而 真正 的 存储 器 读 写 
操作 需要 放 到 再 下 一 个 步骤 中 去 完成 。 对 转移 等 指令 .ALU 完成 的 是 计算 转移 指令 的 目标 
地 址 。 

第 4 步 用 于 完成 存储 器 读 写 功能 ,使 用 第 3 步 计算 得 到 的 存储 器 地 址 选中 的 一 个 存储 
单元 完成 数据 读 写 。 写 内 存 指令 用 于 把 指定 的 一 个 寄存 器 的 内 容 写 人 选 定 的 存储 单元 , 读 
内 存 指令 用 于 把 选 定 的 存储 单元 的 内 容 读 出 来 并 暂 存在 一 个 专用 的 寄存 器 中 ,而 真正 写 人 
到 通用 寄存 器 中 的 操作 需要 放 到 再 下 一 个 步 又 中 去 完成 。 

第 5 步 用 于 把 第 3 步 ALU 运算 的 数据 结果 (已 暂 存 在 一 个 专用 寄存 器 中 ) 或 者 第 4 步 
从 存储 器 中 读 出 来 的 数据 (已 暂 存 在 一 个 专用 寄存 器 中 ) 写 入 到 指令 指定 的 通用 寄存 器 中 。 

综 上 所 述 ,数据 运算 指令 需要 依次 经 过 第 1.2、3、5 这 4 个 步骤 完成 , 写 存 储 器 指令 需要 
依次 经 过 第 1 一 4 这 4 个 步骤 完成 ,而 读 存储 器 指令 需要 依次 经 过 第 1~5 这 5 个 步骤 完成 。 
另外 一 些 指令 也 可 能 经 过 第 1 一 2 这 2 个 步骤 或 者 经 过 第 1 一 3 这 3 个 步骤 完成 。 

初步 结论 ,并 不 是 所 有 的 计算 机 都 必须 把 一 条 指令 的 执行 过 程 划分 为 这 样 的 5 个 步骤 ， 
也 不 见得 每 一 条 指令 都 必须 经 过 全 部 这 5 个 步骤 才能 完成 。 例 如 ,功能 简单 的 指令 可 能 只 
用 到 前 第 2 和 第 3 个 步骤 ,另外 一 些 指令 可 能 还 用 到 后 面 的 第 4 和 第 5 个 步骤 。 在 计算 机 
内 部 ,从 如 何 选择 处理 这 5 个 执行 步 又 的 角度 来 看 ,有 以 下 3 种 方案 ,每 个 方案 对 指令 执行 
速度 和 计算 机 硬件 实现 的 复杂 程度 等 有 较 大 影响 。 

第 1 种 方案 ,不 管 指令 功能 的 复杂 程度 ,让 所 有 指令 都 经 过 这 5 个 时 间 段 完成 , 即 全 部 
指令 都 选用 同一 种 指令 周期 ,从 而 构成 单 指令 周期 的 CPU 系统 。 此 时 必须 依照 功能 最 复 
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杂 执行 用 时 最 长 的 指令 的 运行 要 求 来 确定 指令 周期 的 长 度 ,否则 系统 运行 会 出 错 。 对 那些 
功能 简单 ,只 用 更 少 执行 步骤 就 能 完成 的 指令 ,势必 遇 到 一 些 无 操作 功能 的 执行 步骤 ,造成 
执行 时 间 上 的 浪费 ,降低 了 系统 的 运行 效率 。 此 外 ,这 个 方案 不 利于 在 一 条 指令 执行 过 程 中 
的 硬件 部 件 的 分 时 共享 ,系统 资源 利用 率 最 低 。 结 论 是 : 这 种 方案 理论 上 可 行 ,现实 中 不 
实用 。 

第 2 种 方案 ,依据 不 同 指令 功能 的 繁 简 程 度 来 分 别 确定 各 自 的 指令 周期 ,指令 需要 几 个 
执行 步 又 完成 就 为 它 分 配 几 个 步骤 ,此 时 可 能 有 分 别 用 2 个 步 又 、3 个 步 又 .4 个 步骤 或 5 个 
步 又 完成 的 指令 ,此 而 构成 多 指令 周期 的 CPU 系统 。 这 一 方案 明显 优 于 前 一 方案 ,指令 执 
行 速度 和 硬件 部 件 的 资源 利用 率 更 高 ,是 一 种 较为 实用 的 方案 。 

第 3 种 方案 ,属于 指令 流水 线 的 CPU 系统 , 它 的 着 眼 点 是 进一步 提高 指令 的 执行 速度 。 
思路 在 于 尽 可 能 地 在 指令 的 每 一 个 执行 步骤 都 启动 一 条 新 指令 ,使 程序 中 几 条 相 邻 指令 的 
执行 时 间 尽 可 能 地 重 半 起 来 ,就 像 工业 生产 中 的 流水 线 , 故 称 指令 流水 线 。 它 与 前 2 种 方案 
有 明显 区 别 。 前 2 种 方案 实现 的 是 指令 的 串 行 执行 , 即 前 一 条 指令 完成 之 前 不 会 启动 下 一 
条 指令 ,在 任何 时 间 都 只 有 一 条 指令 处 在 运行 中 ,而 在 指令 流水 的 CPU 系统 中 , 当 确 定 采 
用 5 个 步骤 的 指令 流水 线 时 ,理想 情况 可 能 有 5 条 指令 各 自 处 在 5 个 不 同 的 步骤 中 ,其 理想 
情况 可 以 做 到 每 一 个 执行 步骤 都 会 有 一 条 指令 结束 执行 过 程 。 这 种 方案 会 使 得 硬件 设计 与 
实现 更 复杂 一 些 , 但 带 来 了 更 高 的 性 能 价格 比 ,是 目前 被 广泛 选用 的 、 最 为 实用 的 方案 。 


5.2 基本 寻 址 方式 概述 


寻 址 方式 解决 的 是 如 何在 指令 中 表示 一 个 操作 数 的 地 址 和 指令 地 址 ,如 何 用 这 种 表示 
得 到 操作 数 或 怎样 计算 出 操作 数 的 地 址 。 表 示 在 指令 中 的 操作 数 地 址 ,通常 被 称 为 形式 地 
址 ;用 这 种 形式 地 址 并 结合 某 些 规则 ,可 以 计算 出 操作 数 在 存储 器 中 的 存储 单元 地 址 ,这 一 
地 址 被 称 为 数据 的 物理 (有 效 ) 地 址 。 计 算 机 中 常用 的 基本 寻 址 方式 有 以 下 8 种 类 型 。 

1. 立即 数 寻 址 

操作 数 直接 给 出 在 指令 字 中 , 即 指令 字 中 直接 给 出 的 不 再 是 操作 数 地 址 ,而 是 操作 数 本 
身 。 它 的 主要 用 法 是 把 一 个 确定 的 数值 传送 到 一 个 通用 的 寄存 器 中 ,或 直接 用 于 运算 。 当 
该 数据 占用 的 位 数 较 少时 (如 小 的 整数 ,一 个 西 文字 符 ), 可 把 该 数值 安排 在 第 一 个 指令 字 
中 , 则 在 读 出 指令 的 同时 也 得 到 相关 数据 ;否则 只 能 将 其 存放 在 指令 的 第 二 个 字 中 ,这 就 构 
成 了 双 字 指令 ,如 图 5.3 所 示 。 双 字 指 令 不 利于 指令 流水 .很 少 出 现在 RISC 计算 机 的 指令 
系统 中 。 




















[操作 吗 R, 立即 数 | 操作 码 | R; | 
立即 数 
(单字 指令 (b) 双 字 指令 


图 5.3 立即 数 寻 址 


2. 直接 寻 址 
直接 寻 址 是 在 指令 中 直接 给 出 操作 数 在 存储 器 中 的 地 址 。 这 是 计算 机 中 可 用 的 寻 址 方 
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式 之 一 。 与 立即 数 寻 址 方式 类 似 , 当 该 地 址 占用 的 位 数 较 少 时 (能 访问 的 存储 空间 范围 较 
小 ) ,可 将 其 安排 在 第 一 个 指令 字 中 , 则 在 读 出 指令 的 同时 也 得 到 相关 地 址 ,否则 只 能 用 双 字 
指令 实现 ,如 图 5.4 所 示 。 更 多 情况 下 采用 的 是 变 址 等 其 他 寻 址 方式 提供 内 存单 元 地 址 。 















































操作 码 | R | 直接 地 址 操作 码 | Ri 
直接 地 址 
人 单字 指令 (b) 双 字 指令 
图 5.4 直接 寻 址 


3. 寄存 器 寻 址 寄存器 间接 寻 址 

寄存 器 寻 址 是 在 指令 字 中 给 出 通用 寄存 器 的 编号 (名 字 、 地 址 ) ,所 访问 的 寄存 器 的 内 容 
就 是 运算 用 到 的 数据 。 由 于 表示 一 个 通用 寄存 器 编号 占用 的 位 数 少 , 有 利于 缩短 指令 字 的 
长 度 ; 用 寄存 器 暂 存 数据 并 用 于 完成 运算 速度 更 快 , 故 这 是 最 基本 最 常用 的 寻 址 方式 。 

寄存 器 间接 寻 址 ,在 寄存 器 中 给 出 的 不 是 操作 数 ,而 是 操作 数 在 存储 器 中 的 地 址 ,这 被 
称 为 寄存 器 间接 寻 址 ,这 也 是 最 常用 的 寻 址 方式 之 一 ,如 图 5. 5 所 示 。 


操作 码 | R， 




















存储 器 


操作 数 














一 一 操作 数 的 地 址 [一 一 














通用 寄存 器 
图 5.5 寄存 器 间接 寻 址 


4. 变 址 寻 址 

变 址 寻 址 是 把 在 指令 字 中 给 出 的 一 个 数值 ( 称 为 变 址 偏 移 量 ) 与 一 个 被 称 为 变 址 寄存 器 
的 内 容 相 加 之 和 作为 操作 数 的 地 址 ,用 于 读 写 存储 器 ,如 图 5. 6 所 示 。 它 特别 适合 于 处 理 数 
组 型 数据 。 有 些 计算 机 ,更 设置 了 自动 对 变 址 寄存 器 内 容 自动 增 1 和 减 1 的 操作 功能 。 与 
立即 数 寻 址 方式 类 似 , 依 据 变 址 偏 移 量 的 范围 大 小 , 变 址 指令 可 能 为 单字 或 双 字 两 种 情况 。 


[操作 码 | R | R。 | 变 址 偏 移 量 








存储 器 
相 加 一 | 操作 数 


人] 变 址 寄存 器 加 


通用 寄存 器 
图 5.6 变 址 寻 址 















































5. 相对 寻 址 

相对 寻 址 是 指 把 在 指令 字 中 给 出 的 一 个 数值 ( 称 为 相对 寻 址 偏 移 量 ) 与 程序 计数 器 PC 的 
内 容 相 加 之 和 作为 操作 数 的 地 址 或 转移 指令 的 转移 地 址 ,如 图 5. 7 所 示 。 相 对 寻 址 偏 移 量 决 
定 目标 地 址 与 当前 指令 的 地 址 距离 是 多 少 , 相 对 寻 址 偏 移 量 可 以 为 正 值 或 负 值 ,可 以 有 不 同 的 
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取 值 范围 ,可 能 只 占 一 个 指令 字 的 一 部 分 (一 个 字段 ) ,其 转移 的 地 址 范围 小 ,或 单独 占用 一 个 
计算 机 字 , 则 可 以 转移 到 存储 器 的 任何 位 置 , 故 相 对 寻 址 指令 也 有 单字 与 双 字 之 分 。 


操作 码 变 址 偏 移 量 
1 




















存储 器 | 
相 加 | 一 =| 操作 数 或 指令 | 
rc | | 


























图 5.7 相对 寻 址 


6. 基地 址 寻 址 

基地 址 寻 址 是 指 把 在 程序 中 所 用 的 地 址 与 一 个 特定 的 寄存 器 ( 称 为 基地 址 寄存 器 ) 的 内 
容 相 加 之 和 作为 操作 数 的 地 址 或 指令 的 地 址 。 它 与 变 址 寻 址 .相对 寻 址 形式 上 有 某 些 类 似 
之 处 ,但 其 用 法 却 与 二 者 有 很 大 差别 ,主要 用 于 为 多 道 程序 或 浮动 地 址 程序 定位 存储 器 
空间 。 

7. 间接 寻 址 

间接 寻 址 ,在 指令 字 中 给 出 的 不 是 一 个 操作 数 的 地 址 ,而 是 一 个 操作 数 地 址 的 地 址 ,或 
一 条 指令 地 址 的 地 址 。 采 用 间接 寻 址 读 写 数据 需 两 次 访问 存储 器 ,速度 较 慢 , 少 用 为 好 ,如 
图 5.8 所 示 。 








WR [UR] | 
操作 数 的 地 址 
操作 数 
图 5.8 间接 寻 址 


间接 寻 址 的 形式 地 址 可 以 有 多 种 不 同方 案 , 图 5. 8 中 所 给 出 的 只 是 一 个 最 简单 的 例子 。 

8. 堆栈 寻 址 

堆栈 是 存储 器 中 (或 专用 寄存 器 组 ) 一 块 特定 的 按 “ 后 进 先 出 ”原则 管理 的 存储 区 。 该 存 
储 区 中 被 读 写 单元 的 地 址 是 用 一 个 特定 的 寄存 器 给 出 的 ,该 寄存 器 被 称 为 堆栈 指针 (Stack 
Pointer,SP) 。 如 果 有 些 指令 .其 操作 码 部 分 已 经 指明 一 个 操作 数 为 堆栈 中 的 一 个 单元 ( 通 
常 为 堆栈 栈 顶 ) 的 内 容 . 则 它 就 已 经 约定 将 使 用 SP 访问 该 单元 , 故 不 必 在 指令 的 地 址 字段 
中 另 加 指定 。 在 采用 堆栈 结构 的 计算 机 系统 中 ,大 部 分 指令 表面 上 都 表现 为 无 操作 数 指令 
的 形式 。 通 常情 况 下 ,在 读 写 堆栈 中 的 一 个 单元 的 前 后 ,都 伴 有 自动 完成 对 SP 内 容 的 增 量 
或 减 量 操作 。 

请 注意 ,操作 数 地 址 字段 也 被 用 于 给 出 指令 地 址 ,例如 转移 指令 的 转移 目标 地 址 , 子 程 
序 的 人口 地 址 等 。 

上 述 8 种 寻 址 方式 ,是 计算 机 中 常用 的 基本 寻 址 方式 ,可 以 单独 使 用 ,也 可 以 把 它们 中 
的 某 几 种 组 合 在 一 起 ,如 变 址 后 再 间接 寻 址 . 变 址 与 基地 址 寻 址 的 组 合 ,间接 寻 址 还 可 以 连 
续 多 次 执行 等 。 此 外 .不 是 每 一 台 计 算 机 都 使 用 所 有 的 寻 址 方式 ,也 不 一 定 要 把 寻 址 方式 设 
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计 得 很 复杂 ,简单 的 寻 址 方式 可 以 使 计算 机 系统 有 更 高 的 运行 效率 。 


5.3 指令 系统 举例 


计算 机 的 指令 系统 有 RISC 和 CISC 两 种 类 型 。RISC 是 20 世纪 80 年 代 出 现 的 全 新 概 
念 的 计算 机 系统 。 它 以 精简 高 效 的 指令 系统 、 精 巧 高 速 的 硬件 组 成 精妙 智能 的 编译 软件 ， 
达到 了 低 价 与 高 性 能 的 理想 目标 ,也 就 是 说 ,执行 同样 处 理 功能 的 程序 所 占用 的 时 间 要 比 
CISC 计算 机 更 短 。 请 看 公式 : P=TIXCPIXT, 符 号 已 表示 执行 一 个 程序 所 用 的 时 间 , 它 由 
该 程序 中 包含 的 机 器 指令 的 总 条 数 了 ,执行 一 机 器 指令 所 需要 的 机 器 周期 数 CPI, 每 个 机 器 
周期 的 时 间 长 度 工 这 3 个 数值 的 乘积 决定 。 这 3 个 数值 在 RISC 和 CISC 两 种 机 器 中 有 比 
较 大 的 差距 ,如 表 5. 1 所 示 , RISC 机 器 的 运行 性 能 可 能 要 比 CISC 机 器 高 2 一 5 倍 。 


表 5.1 RISC 和 CISC 的 对 比 





RISC 





RISC 计算 机 的 指令 格式 规范 上 且 种 类 少 ,使 用 的 寻 址 方式 简单 ,指令 条 数 少 ,指令 完成 
的 操作 功能 简单 。 大 量 的 统计 结果 表明 ,在 CISC 机 器 的 所 有 指令 中 ,功能 简单 .所 用 硬件 
更 节省 的 约 20% 的 指令 ,将 占用 程序 80% 的 运行 时 间 ; 反 过 来 说 ,另外 的 约 80% 的 功能 更 
复杂 硬件 实现 代价 很 高 的 指令 并 不 被 经 常 使 用 。 到 了 RISC 计算 机 中 ,更 倾向 选用 软件 子 
程序 来 实现 这 些 指令 的 功能 ,使 硬件 实现 变 得 更 为 精简 ,运行 速度 更 快 。RISC 计算 机 追求 
的 目标 之 一 ,就 是 使 指令 每 一 步 操作 所 用 的 时 间 要 尽 可 能 短 ,并且 力争 在 每 个 执行 步骤 都 能 
完成 一 条 指令 的 执行 过 程 。 同 时 尽力 在 编译 程序 中 增强 性 能 优化 能 力 , 从 硬件 软件 两 个 方 
面 来 提高 RISC 计算 机 的 性 能 。 

下 面 介绍 4 种 计算 机 的 指令 系统 实例 。 在 这 几 个 指令 系统 中 ,指令 操作 码 部 分 的 组 织 
和 编码 ,操作 数 地 址 字段 的 设计 方案 各 有 一 定 的 代表 性 。 其 中 Pentium [计算 机 的 指令 系 
统 属于 典型 的 CISC 结构 ;MIPS32 计算 机 的 指令 系统 属于 典型 的 RISC 结构 ;PDP-11 计算 
机 的 指令 格式 ,长 度 扩展 的 指令 操作 码 和 规范 、 别 致 的 寻 址 方式 是 它 的 突出 特点 ;上 述 3 种 
指令 系统 更 多 地 用 于 开阔 眼界 .扩展 学 生 的 知识 面 。 教 学 计算 机 的 指令 系统 是 由 本 书 作者 
专门 为 计算 机 组 成 原理 课程 的 教学 和 实验 而 设计 的 ,指令 格式 简明 规范 , 既 有 多 种 基本 寻 址 
方式 、 比 较 齐 全 的 常用 指令 ,又 有 配套 的 汇编 语言 支持 ,这 套 指令 与 多 数 人 较为 熟悉 的 Intel 
8086 计算 机 的 指令 有 某 些 类 似 但 更 为 简化 ,选用 这 套 指 令 系统 设计 、 实 现 了 多 个 型 号 的 教 
学 实验 设备 ,在 本 教材 中 说 到 的 教学 计算 机 更 多 地 针对 TEC-XP-T 这 个 型 号 。 教 学 计算 机 
的 指令 系统 将 在 教学 的 各 个 环节 中 反复 用 到 ,更 多 地 关注 一 些 是 必要 的 。 


5.3.1 Pentium 开 计 算 机 的 指令 系统 


Pentium 计算 机 是 应 用 面 较 广 .影响 力 较 大 的 个 人 计算 机 ,其 指令 系统 有 一 定 的 典型 
性 。 这 里 更 多 地 介绍 它 的 指令 格式 和 选用 的 寻 址 方式 ,给 出 部 分 指令 而 不 是 完整 的 指令 集 。 
Pentium 人 [计算 机 的 指令 格式 如 图 5. 9 所 示 。 

下 面 给 出 指令 前 级 各 部 分 的 功能 简介 。 
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0 或 1 字 节 0 或 1 字 节 0 或 1 字 节 0 或 1 字 节 
Instruction Segment Operand Size Address Size 
Prefix Override Override Override 
(a) 指令 前 绥 
] 或 ? 字 节 0 或 ! 字 节 0 或 ! 字 节 0-4 字 节 0-4 字 节 
Opcode Mod RIM SIB Displacement JImmediate 
Er TW 
| Mod |Reg/Opcode RM SS | Index Base 
中 Lt 
(b) 指令 格式 


图 5.9 Pentium [的 指令 格式 


(1) 如 果 Pentium 计算 机 的 指令 带 有 自己 的 前 级 Instruction Prefix, 可 由 1 一 4 个 重复 
出 现 的 LOCK 部 分 组 成 ,用 于 保证 在 多 处 理 机 环境 下 ,处理 机 能 以 互 斥 的 方式 共享 主 存储 
器 。 通 过 这 种 办 法 处 理 字符 串 , 比 起 使 用 软件 办 法 实现 要 快 得 多 。 

(2) Segment Override 明确 指出 在 指令 中 使 用 哪 一 个 段 寄 存 器 。 

(3) Operand Size Override 用 于 指出 指令 中 的 操作 数 是 16 位 还 是 32 位 。 

(4) Address Size Override 用 于 指出 在 本 指令 中 计算 存储 器 地 址 时 使 用 16 位 还 是 32 
位 的 变 址 偏 移 量 Displacement。 

下 面 给 出 指令 格式 各 部 分 的 功能 简介 。 

(1) Pentium 了 [的 指令 的 操作 码 可 以 由 1 一 2 个 字 节 组 成 ,在 指明 操作 功能 的 同时 ,有 时 
还 用 于 指出 操作 数 的 长 度 是 字 节 、 半 字 或 者 全 字 , 存 储 器 访问 是 读 操作 还 是 写 操作 ,立即 数 
是 否 需 要 符号 位 扩展 等 。 

(2) ModR/M 字段 和 接 下 来 的 SIB 字段 用 于 给 出 寻 址 信息 ,例如 数据 是 在 寄存 器 中 还 
是 在 存储 器 中 ,如果 是 在 存储 器 中 ,本 字 节 用 于 指出 本 指令 使 用 的 寻 址 方式 ,2 位 的 Mod 和 
3 位 的 R/W 字段 可 以 形成 32 个 值 . 区 分 8 个 通用 寄存 器 和 24 种 变 址 方法 ;3 位 的 Reg/ 
Opcode 字段 可 以 用 于 指定 一 个 寄存 器 的 编码 ,或 者 与 Mod 字段 一 起 用 于 寻 址 方式 的 译 码 。 

(3) SIB 字段 可 以 与 Mod 字段 一 起 用 于 寻 址 方式 的 译 码 ,SIB 也 被 划分 成 3 个 子 字段 ， 
2 位 的 SS 用 于 指定 变 址 寻 址 计算 中 的 放大 因子 ,3 位 的 Index 和 Base 分 别 用 于 指定 变 址 寄 
存 器 和 基地 址 寄存 器 。 

(4) Displacement 字段 用 于 提供 变 址 寻 址 方式 下 的 偏 移 值 ,可 以 为 8、16 或 32 位 长 度 。 

(5) Immediate 字段 用 于 提供 立即 数 寻 址 方式 下 的 立即 数 ,可 以 为 8、16 或 32 位 长 度 。 

这 套 指 令 系 统 的 特点 : 指令 操作 码 还 含有 区 分 寻 址 方式 的 某 些 信息 ; 变 址 寻 址 的 
Offset 的 字段 可 以 为 1.2、4 个 字 节 ,可 以 在 指令 中 支持 访问 更 大 的 存储 器 空间 。 

下 面 分 类 列 出 完成 整数 运算 和 其 他 一 些 功 能 的 常用 指令 ,Pentium 呈 计算 机 的 指令 系 
统 混合 了 32 位 字 长 的 指令 和 16 位 字 长 的 指令 模式 ,后 者 是 为 了 与 原 有 的 8086 机 型 保持 软 
件 兼 容 ,其 代价 是 使 这 套 指令 系统 的 实现 更 为 复杂 。 





算术 与 逻辑 运算 指令 数据 传送 指令 
RDD DST, SRT MOVE DST, SEC 
SUB DST, SRT PUSH SRC 


ADC DST, SFRT POP DST 
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SEB DST, SRT XCH6 D8T, SRC; 内 容 交 换 

AND DST, SET IEA DST, sRC; 存 SEC 的 优先 地 址 到 psT 
CR DeT, SET CMV DsT, SFC; 比 较 2 个 串 的 内 容 
XOR DST, SET 

TST SRCLSRC2 逻辑 移 位 和 循环 移 位 指令 

MP SRC1,SRC2 SAL DsT, # 算术 左 移 

MOL SRC; 无 符号 数 除法 SAR DST, # 算术 右 移 

IMT SRC; 带 符号 数 除法 sHL DsT, # ;逻辑 左 移 

DIV SEC; 无 符号 数 除法 SHR DST, # ;逻辑 右 移 

IDIV SFC; 带 符号 数 除法 FOL D8T, # ;循环 左 移 

I ner FOR D8T, # ;循环 右 移 

DEC DeT RCL DT, # ; 带 进位 c 左 移 

NES D6T; 变 补 码 RCR DST, # ; 带 进位 c 游 移 

NOT DeT 

控制 转移 指令 字符 串 指令 

TP RDFR ICps 

Jexs BDIR; 条 件 转移 Smos 

CALL RDDR MDVS 

FET QEs 

IFET sms 

ICOPxx; 循 环 直到 条 件 满 足 条 件 码 指令 

INTex sr 

Imo cr 

其 他 指令 arc 

SRP DST sD 

NoP; 空 操作 cD 

HaLT; 停 机 STT 

HAL,PORT; 输 入 CLII 

OUT PORI,AL; 输 出 EUSHFD; 状 态 寄存 器 内 容 进 堆栈 
waIT; 等 待 中 断 FOPED; 状 态 寄存 器 内 容 出 堆栈 


这 里 的 符号 含义 说 明 : DST 是 指 目的 操作 数 地 址 ;SRC 是 指 源 操作 数 地 址 ;* # ”是 指 
移 位 的 位 数 。 


5.3.2 MIPS32 计算 机 的 指令 系统 


MIPS( Microprocessor without Interlocked Pipeline Stages) 是 20 世纪 80 年 代 中 期 推 
出 的 RISC 结构 的 计算 机 系统 ,多 年 来 形成 了 32 位 或 64 位 字 长 .功能 各 异 的 几 个 型 号 的 产 
品 ,我 们 选择 其 中 的 MIPS32 为 例 进行 介绍 。 

MIPS32 是 32 位 字 长 ,典型 RISC 结构 指令 系统 的 计算 机 。 其 指令 格式 简单 ,指令 数量 
较 少 ,只 选用 3 种 基本 寻 址 方式 .通用 寄存 器 较 多 ,编译 系统 简单 高 效 , 更 方便 实现 指令 流 
水 。3 种 指令 格式 如 图 5. 10 所 示 。 

在 MIPS32 型 号 的 系统 中 ,还 提供 一 套 16 位 字 长 的 MIPSl6e 指令 系统 ,以 便 更 方便 地 
支持 租 入 式 系 统 的 使 用 要 求 。 

第 1 种 指令 称 为 R 型 指令 .完成 的 功能 例如 rd<- rs op rt 
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-| 26 25 2120 1615 1110 本 0 
op TS rt | rd | sa func 
op TS mt | immediate 
op target 











图 5. 10 MIPS32 机 的 指令 格式 


rd<—(rs<rt) 

即 rs 的 内 容 比 rt 的 内 容 小 则 rd 置 1, 否 则 清 0。 

第 2 种 指令 称 为 I 型 指令 ,完成 的 功能 例如 rt< rs op immediate 
rt<-memory[base 十 offset] 

memory[ base+offset |]<—rt 

车 rt=rs, 转 移 到 地 址 PC 十 offsetX4, 和 否则 顺序 执行 ; 

若 rt 一 >rs, 转 移 到 地 址 PC 十 offsetX4, 和 否则 顺序 执行 。 

第 3 种 指令 称 为 了 型 指令 ,完成 无 条 件 跳 转 的 操作 功能 。 用 PC 的 最 高 4 位 拼接 target 
的 值 作 为 跳 转 的 指令 地 址 。 

下 面 给 出 某 些 典型 指令 的 例子 ,只 提供 汇编 语句 格式 ,并 不 说 明 这 些 指 令 的 具体 功能 。 
add $1,$2,$3, addi $1,$ 2,100, addu $1,$ 2,$3, addiu $ 1,$ 2,100 

sub $1,$2,$3, Subu $1,$2,$3 


x 


A 


mlt $2,$3, multu $2,$3, div $2,$3, divu $2,$3 
mfhi $1, mflo $1, mfoo $1,$ epc, 

and $1,$2,$3, or $1,$2,$3, andi $1,$ 2,100, ori $1,$2,100 
311 $1,$2,10, srl $1,$2,10 

lw $ 1,100($ 2), sw $ 1,100($ 2), lui $1,100 


beq $1,$ 2,100, bne $1,$ 2,100, 
SIt $1$2,$3, slti$1,$2,100, sltu$1,$2,$3, sltiu$1,$2,100 
j 10000, jr $31, jal 10000 


5.3.3 PDP-11 计算 机 的 指令 系统 


PDP-11 是 20 世纪 60 年 代 初 由 美国 DEC 公司 研制 成 功 的 小 型 (当时 情况 ) 系 列 机 , 曾 
被 广泛 应 用 。1978 年 ,DEC 公司 在 此 基础 上 又 推出 32 位 字 长 .性 能 更 高 的 VAX-11 系 
列 机 。 

PDP-11 计算 机 的 主要 特点 体现 在 以 下 5 个 方面 。 

(1) 采用 单 总 线 CUNIBUS) 结 构 , 即 中 央 处 理 机 、 主 存储 器 、 全 部 外 围 设备 都 接 在 唯一 
的 一 组 总 线 上 ,优点 是 硬件 结构 简单 ,易于 扩展 ,缺点 是 系统 运行 效率 低 。 

(2) 该 计算 机 的 机 器 字 长 16 位 ;CPU 内 有 8 个 通用 寄存 器 ,分 别 用 尺 , 一 R; 表示 ,但 R。 
和 R; 分 别 为 堆栈 指针 SP 和 程序 计数 器 PC, 真 正 能 通用 的 只 有 Re 一 Rs 。 

(3) 该 机 可 以 按 字 或 字 节 寻 址 ,指令 中 有 处 理 字 类 型 数据 和 处 理 字 节 类 型 数据 的 两 类 
指令 。 


(4) 操作 码 使 用 逐 段 扩展 技术 ,不 同 的 指令 使 用 不 同位 数 (长 度 ) 的 操作 码 , 从 4 位 到 16 
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位 不 等 ,在 很 短 的 指令 字 中 充分 发 挥 每 一 位 的 效用 。 
(5) 在 指令 的 操作 数 地 址 部 分 ,采用 统一 寻 址 方式 访问 通用 寄存 器 、 主 存 及 外 围 设备 ， 


主 存 和 外 围 设备 统一 编 址 ,没有 专门 的 IO 指令 。 指 令 中 用 6 
个 二 进 制 位 (bit) 表 示 一 个 操作 数 的 地 址 ,如 图 5. 11 所 示 。 
其 中 ,Mod 用 于 确定 寻 址 方式 ,R 用 于 指定 寄存 器 编号 ,各 





Mod R 
3 位 3 位 
图 5.11 操作 数 的 地 址 格式 














占 3 位 ,能 分 别 表 示 8 种 不 同 的 寻 址 方式 和 8 个 不 同 的 寄存 
器 。R 的 取 值 从 000 到 111 ,分别 表示 Ro 到 Ri, 其 中 Rs 和 R? 也 可 以 写成 SP( 堆 栈 指针 ) 和 
PC( 程 序 计 数 器 ) ,真正 能 通用 的 只 有 Ru 一 Rs 。 

Mod 的 8 个 取 值 分 别 代 表 8 种 寻 址 方式 ,具体 如 表 5.2 所 示 。 


表 5.2 Mod 的 取 值 与 寻 址 方式 的 对 应 关系 
































Mod 取 值 寻 址 符 寻 址 方式 
000 R 寄存 器 寻 址 ,R 的 内 容 即 为 操作 数 
001 (R) 寄存 器 间接 寻 址 ,R 的 内 容 是 操作 数 的 地 址 
Gi 吕 竹 寄存 器 间接 寻 址 并 自动 增 量 ,R 的 内 容 是 操作 数 的 地 址 ,用 后 R 的 内 容 
执行 增 1( 对 字 节 指令 ) 或 增 2( 对 字 指 令 ) 
i @(R)+ 间接 寻 址 并 自动 增 量 ,R 的 内 容 是 操作 数 地 址 的 地 址 ,用 后 R 的 内 容 增 
1( 对 字 节 指令 ) 或 增 2( 对 字 指 令 ) 
od _(R) 自动 减 量 的 寄存 器 间接 寻 址 ,修改 后 的 R 的 内 容 是 操作 数 的 地 址 , 即 用 
前 先 对 R 的 内 容 执行 减 1( 对 字 节 指令 ) 或 减 2( 对 字 指 令 ) 
@—R) 自动 减 量 并 间接 寻 址 ,修改 后 的 R 的 内 容 是 操作 数 地 址 的 地 址 , 即 用 前 
先 对 R 的 内 容 执行 减 1( 对 字 节 指令 ) 或 减 2( 对 字 指 令 ) 
110 X(R) 变 址 寻 址 ,将 X 与 R 的 内 容 相 加 之 和 作为 操作 数 的 地 址 
1 @X(R) 变 址 并 间接 寻 址 ,将 X 与 R 的 内 容 相 加 之 和 作为 操作 数 地 址 的 地 址 


可 以 看 到 ,在 Mod 的 高 两 位 取 值 相同 、 仅 最 低位 的 取 值 不 同 的 两 种 寻 址 方式 中 ,最 低位 
取 值 为 1 的 寻 址 方式 ,总 是 在 前 一 种 寻 址 方式 上 多 了 一 次 间接 寻 址 操作 。 

还 可 以 发 现 ,不 能 把 2.3.6.7 这 4 种 寻 址 方式 按照 上 述 规定 用 于 Ri, 即 程序 计数 器 
PC, 为 此 可 以 把 27、37、67、77 这 几 个 组 合 变通 一 下 ,用 于 另外 的 寻 址 方式 ,如 表 5. 3 所 示 。 


表 5.3 另外 几 种 寻 址 方式 














ee 寻 址 符 寻 址 方式 
27 | #n | 立即 数 寻 址 , #n 为 立即 数 , 放 在 指令 的 第 二 个 字 中 
37 | @#A | 直接 地 址 寻 址 ,#A 为 地 址 , 放 在 指令 的 第 二 个 字 中 
67 | X 相对 寻 址 ,( 当 前 指令 地 址 十 入 十 XX 为 有 效 地 址 ,X 在 指令 的 第 二 个 字 中 
77 | @x | 相对 加 问 接 寻 下 (当前 指令 地 址 十 全 十 X 为 地 址 的 地 址 ,在 指令 的 第 二 个 





字 中 





有 了 上 述 介绍 ,下 面 就 可 以 简明 地 对 PDP-11 计算 机 的 指令 格式 进行 分 类 说 明 。 
(1) 双 操 作 数 指令 ,采用 4 位 操作 码 , 每 个 操作 数 形式 地 址 占 6 位 ,如 图 5. 12 所 示 。 
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操作 码 SS( 源 操作 数 ) DD( 目 的 操作 数 ) 
OP Mod R | Mod R 
上 上 二 证 
01 SS DD MOV 11 SS DD MOVB 
06 SS DD ADD 16 SS DD SUB 


图 5.12 双 操 作 数 指令 格式 























多 数 情况 下 .操作 码 最 高 一 位 的 值 ,用 于 区 分 是 字 指 令 还 是 字 节 指令 ,为 1 则 是 字 节 指 
令 , 并 在 汇编 语句 名 后 用 跟 字符 B 标 记 ( 下 同 ); 加 、 减 指令 不 支持 字 节 运算 , 故 可 以 用 06 和 
16 操作 码 分 别 表 示 ADD 和 SUB 指令 。 

(2) 单 操作 数 指令 ,采用 10 位 操作 码 ,一 个 操作 数 形式 地 址 占 6 位 ,如 图 5. 13 所 示 。 














操作 码 DD( 目 的 操作 数 ) 
OP [| Ma |] R 
0050 DD CLR 1050 DD CLRB 
0001 DD JMP 0030 DD SWAP 


图 5.13 单 操作 数 指令 格式 1 


另 一 组 单 操作 数 指 令 , 采 用 10 位 操作 码 , 一 个 操作 数 形式 地 址 占 6 位 。 这 里 的 操作 数 
可 能 为 目的 操作 数 、 源 操作 数 、 立 即 数 , 由 指令 本 身 决定 ,如 图 5.14 所 示 。 

















操作 码 DD/NN/SS 
OP [| Mod R 
0060 DD ROR 1060 DD RORB 
0061 DD ROL 1061 DD ROLB 


图 5.14 单 操作 数 指令 格式 2 


(3) 无 操作 数 指令 ,指令 字 的 全 部 16 位 都 用 作 操 作 码 , 如 图 5.15 所 示 。 








操作 码 
| OP | 
000000 HALT 104000-104377 EMT 
000001 WAIT 104400~104477 TRAP 


图 5.15 无 操作 数 指令 格式 


(4) 特殊 格式 的 指令 ,包括 以 下 3 种 类 型 。 

Q@ 双 操作 数 指令 ,采用 7 位 操作 码 , 其 中 的 一 个 操作 数 形式 地 址 只 用 R 表示 。 

加 单 操作 数 指令 ,采用 13 位 操作 码 ,操作 数 形式 地 址 只 用 R 表示 。 

@ 其 他 特殊 指令 ,主要 是 相对 转移 指令 ,采用 8 位 操作 码 和 8 位 补 码 的 偏 移 量 表示 。 


5.3.4 教学 计算 机 的 指令 系统 


1. 确定 教学 计算 机 指令 系统 的 原则 

合理 地 确定 一 台 计 算 机 的 指令 系统 ,无 论 对 计算 机 厂家 还 是 对 最 终 用 户 来 说 都 是 十 分 
重要 的 事情 。 它 密切 关系 到 计算 机 设计 与 实现 的 复杂 程度 和 生产 成 本 ,计算 机 使 用 的 难 易 
程度 和 运行 效率 。 对 主要 用 于 教学 实例 和 教学 实验 目的 的 16 位 字 长 的 计算 机 ,更 多 地 应 关 
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注 它 在 教学 过 程 中 的 作用 和 使 用 方法 。 设 计时 的 主要 思想 如 下 。 

(1) 尽 可 能 精 小 的 指令 集 , 指 令 数 目 要 适当 地 少 , 较 短 的 指令 格式 ,简单 的 寻 址 方式 , 单 
字 指 令 为 主 ,每 条 指令 的 功能 要 尽 可 能 地 简单 。 

(2) 指令 系统 要 有 一 定 的 完备 程度 ,有 较 好 的 典型 性 ,给 出 的 指令 格式 适当 规范 ,指令 
分 类 合理 ,符合 人 们 通常 的 编程 使 用 习惯 ,指令 执行 步骤 容易 理解 。 

(3) 更 高 的 可 扩充 性 , 即 为 学 生 添加 各 种 新 的 指令 留 下 比较 充足 的 余地 ,包括 为 每 一 类 
指令 保留 多 条 要 学 生 亲 自 实现 的 指令 。 

(4) 符合 课程 教学 用 计算 机 的 特定 要 求 。 选 用 16 位 字 长 指令 格式 ,指令 操作 码 固定 为 
8 位 长 度 , 实 现 这 套 指令 系统 时 ,计算 机 硬件 组 成 和 指令 执行 流程 要 简单 。 

2. 教学 计算 机 的 指令 系统 说 明 与 指令 分 类 


1) 指令 格式 


教学 计算 机 的 指令 系统 有 单字 和 双 字 指令 ,第 一 个 指令 字 的 高 8 位 是 指令 操作 码 , 低 8 
位 和 双 字 指令 的 第 二 个 指令 字 是 操作 数 地 址 字段 ,分 别 有 3 种 用 法 ,如 图 5. 16 所 示 。 





DR SR 


和 
Re 10 庙 口 地 地 /相对 偏 移 时 














立即 数 / 直 接 内 存 地 址 / 变 址 偏 移 量 





图 5.16 教学 计算 机 的 指令 格式 


8 位 的 指令 操作 码 ( 记 作 *IRis~IRs”) 中 各 位 的 含义 如 下 。 

(1) IRis ,IRu 用 于 区 分 指令 组 : 0X 表示 A 组 ,10 表示 B 组 ,11 表示 D 组 。 

(2) IRis 用 于 区 分 基本 指令 和 扩展 指令 : 基本 指令 该 位 为 0, 扩展 指令 该 位 为 1。 

(3) IRi 用 于 简化 控制 器 实现 , 暂 定 该 位 的 值 为 0。 

(4) IRun ~IRs 用 于 区 分 同一 指令 组 中 的 不 同 指令 。 

操作 数 地 址 字段 的 设计 结果 如 下 。 

(1) DR( 目 的 寄存 器 ) 和 SR( 原 寄存 器 ) 是 4 位 的 寄存 器 编号 ,可 寻 址 16 个 寄存 器 。 
(2) 8 位 的 IO 端口 地 址 ,默认 的 串 行 接口 地 址 为 十 六 进 制 的 80 和 81。 

(3) 8 位 的 相对 寻 址 偏 移 量 offset, 转 移 范围 从 一 128 一 十 127。 

(4) 16 位 的 立即 数 由 指令 的 第 2 个 字 提 供 , 用 于 把 这 个 数值 传送 到 选 定 的 寄存 器 中 。 
(5) 16 位 的 直接 地 址 由 指令 的 第 2 个 字 提供 ,作为 指令 转移 地 址 或 子 程序 人 口 地 址 。 
(6) 16 位 的 变 址 偏 移 量 由 指令 的 第 2 个 字 提 供 , 用 于 以 变 址 寻 址 方式 访问 内 存 。 


2) 指令 分 类 


按 不 同 的 分 类 标准 ,可 以 把 16 位 机 的 指令 划分 成 不 同 的 指令 组 ,具体 如 下 。 


(1) 从 指令 字 长 度 


区 分 ,有 单字 指令 和 双 字 指令 ,也 允许 定义 与 使 用 3 字 指 令 。 





(2) 从 操作 数 的 个 数 区 分 ,有 双 操作 数 指令 , 单 操作 数 指令 和 无 操作 数 指令 。 

(3) 从 使 用 的 寻 址 方式 区 分 ,有 寄存 器 寻 址 .寄存 器 间接 寻 址 .立即 数 寻 址 直接 寻 址 、 
变 址 寻 址 、 相 对 寻 址 、 堆 栈 寻 址 等 多 种 基本 寻 址 方式 的 不 同类 别 指令 。 

(4) 从 指令 执行 步 又 区 分 .有 采用 2 步 .3 步 ,4 步 完成 的 这 样 3 组 。 

(5) 从 指令 功能 区 分 ,如 表 5.4 所 示 。 
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表 5.4 指令 从 功能 划分 所 包含 的 类 型 


























指令 类 型 包含 的 指令 
ADD.SUB.AND.OR.XOR.CMP.TEST .DEC INC、 
人 攻 
bt et ADC.SBB.NOT 
数据 传送 类 指令 MVRR.MVRD 
移 位 类 指令 SHL.SHR.RCL.RCR.ASR 
LDRR. STRR. PUSH. POP. PSHF. POPF、LDPC、 
读 写 洲 今 
读 写 内 存 类 指令 LDRA.STRA .LDRX.STRX 
输入 /输出 类 指令 IN.OUT 
JR.JRC. JRNC. JRZ. JRNZ. JMPA. CALA. RET、 
从 号 全 
A JRS.JRNSJMPR.CALR.IRET 
其 他 指令 CLC.STC.EI.CI 


教学 计算 机 系统 实现 了 其 中 的 30 条 基本 指令 ,用 于 支持 监控 程序 和 简单 的 汇编 语言 程 
序 设计 。 保 留 了 其 余 19 条 扩展 指令 供 学 生 在 教学 实验 中 进行 扩展 , 即 完成 对 这 些 指令 的 设 
计 与 调试 ,当然 ,还 可 以 扩展 另外 一 些 指令 。 
在 表 5.5 和 表 5. 6 中 分 别 汇总 了 前 面 介绍 的 基本 指令 (已 经 实现 ,属于 基本 配置 ) 和 扩 
展 指令 (已 经 实现 ,属于 可 选 配 置 ) 的 有 关内 容 。 表 中 的 分 组 是 按照 指令 的 执行 步骤 来 划分 


的 ,A 组 指令 用 2 步 完 成 ,B 组 指令 用 3 步 完 成 .D 组 指令 用 4 步 完 成 。 


表 5.5 基本 指令 汇总 表 





指令 格式 汇编 语句 操作 数 个 数 CZVS 分 组 功能 说 明 
00000000 DRSR ADD DR.SR 2 Xxx% DR--DR 十 SR 
00000001 DRSR SUB DR.SR 2 基准 DR--DR 一 SR 
00000010 DRSR AND DR.SR 六 Ox0x DR<—DR and SR 
00000011 DRSR CMP DR.SR 2 x DR-SR 
00000100 DRSR XOR DR.SR 多 Ox0# DR--DR xor SR 
00000101 DRSR TEST DR.SR 2 Ox0x DR and SR 
00000110 DRSR OR DR.SR 2 Ox0* DR--DR or SR 
00000111 DRSR MVRR DR.SR 2 EE DR<—SR 
00001000 DR0000 DEC DR 1 XX DR<DR—1 
00001001 DR0000 INC DR 1 x A | DR<DR+1 
00001010 DR0000 SHL DR x DR.C<-DRX2 
00001011 DR0000 SHR DR 1 x 组 | DR.C<_DR/2 
01000001 OFFSET | JR ADR 1 “0 无 条 件 跳 转 到 ADR 
01000100 OFFSET | JRC ADR 让 a ”| C=1 时 跳 转 到 ADR 
01000101 OFFSET | JRNC ADR 1 外 C=0 时 跳 转 到 ADR 
01000110 OFFSET | JRZ ADR LE ee 2Z==1 时 跳 转 到 ADR 
01000111 OFFSET | JRNZ ADR 1 a Z 一 0 时 跳 转 到 ADR 
10000000 0000000 JMPA ADR 1 oe 无 条 件 跳 到 ADR 
ADR(16 位 ) 

10001000 DR0000 MVRD DR.DATA a DR<DATA 
DATA(16 位 ) 

10000010 IO PORT | IN 1/O PORT 理 a RO<[1/O PORT] 
10000110 1/O PORT | OUT LO PORT 1 0 [IO PORT]<-Ro 
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续 表 第 
上 Cn 
指令 格式 汇编 语句 操作 数 个 数 分 组 功能 说 明 章 
10001001DRSR LDPC DR,[SR] PC<-[SR] 
10000001DRSR LDRR DR.[SR] 2 DR<[SR] 
10000011DRSR STRR [DR] .SR 2 B |[DR]<SR 
10000100 00000000 | PSHF 0 5 组 ”| FLAG 入 栈 
10000101 0000SR PUSH SR 1 四 指 | SR 入 栈 
10000111 DR0000 POP DR 1 a 令 ”| DR 出 栈 
10001100 00000000 | POPF 0 关 % 关 关 FLAG~<- 出 栈 
10001111 00000000 | RET 0 “0 子 程序 返回 
11001110 00000000 | CALA ADR 1 0 D 组 | 调用 首 地 址 为 ADR 
ADR(16 位 ) 指令 | 的 子 程序 











注 : @ 表 中 CZVS 一 列 ,“x "影响 状态 位 ,”。 "不 影响 状态 位 。 
@ 运算 器 中 有 16 个 累加 器 Ro 一 Ris ,其 中 Rs 用 作 堆 栈 指针 SP;IN.OUT 指令 默认 使 用 Ro ,对 其 他 指令 Ro 是 通用 
寄存 器 ;其 余 寄存 器 用 作 通 用 寄存 器 , 即 指令 中 的 DR、SR。 


图 LDPC 是 特权 指令 ,只 用 在 监控 程序 中 ,不 能 在 用 户 程序 中 使 用 。 


表 5.6 扩展 指令 汇总 表 




















指令 格式 汇编 语句 操作 数 个 数 | CZVS | 分 组 功能 说 明 
00100000 DRSR ADC DR.SR . 关 关 关 关 DR<-DR 十 SR 十 C 
00100001 DRSR SBB DR.SR 2 xX DR<-DR 一 SR 一 C 
00101010 DR0000 | RCL DR 1 x DR 带 进位 C 循环 左 移 
00101011 DR0000 | RCR DR 1 Yo DR 带 进位 C 循环 右 移 
00101100 DR0000 | ASR DR 1 Yo 和 DR<—DR 算术 右 移 
00101101 DR0000 | NOT DR 0Ox0。 DR- -DR 
01100000 0000SR | JMPR SR 1 tt 跳 转 到 SR 给 的 地 址 
01100100 OFFSET | JRS ADR 1 四 令 | S 一 1 时 跳 转 到 ADR 
01100101 OFFSET | JRNS ADR 5 S=0 时 跳 转 到 ADR 
01101100 00000000 | CLC 0 0… C=0 
01101101 00000000 | STC 0 1… CE 
01101110 00000000 | EI 0 0 开 中 断 ,INTE<-1 
01101111 00000000 | DI 0 0 关中 断 ,INTE<-0 
11100100 DR0000 | LDRA DR.[ADR] 2 0 B | DR<[ADR] 

ADR(16 位 ) 组 

11100111 0000SR STRA [ADR].SR 2 oe 指 | [ADR]<-SR 

ADR(16 位 ) 令 

11100101 DRSR LDRX DR.OFFSET[SR] 2 a DR<-[DATA+SR] 
ADR(16 位 ) D 

11100110 DRSR STRX DR.OFFSET[SR] 2 a 组 | [DATA 十 SR]<-SR 
ADR(16 位 ) 指 

11100000 0000SR “| CALR SR 1 “0. 令 | 调用 SR 指明 的 子 程序 
11101111 00000000 | IRET 0 oe 中 断 返回 

















注 : @ 表 中 CZVS 一 列 ,“* "表示 对 应 的 状态 位 在 该 指令 执行 后 会 被 重 置 !”* ”状态 位 在 该 指令 执行 后 不 会 被 


修改 。 


@ 扩展 指令 的 功能 、 格 式 、 操 作 码 和 操作 数 地 址 字段 的 确定 , 留 给 同学 自己 设计 。 表 中 给 出 的 只 是 可 能 的 一 种 选择 ， 
但 同学 们 一 定 要 认识 到 ,这 里 的 基本 指令 和 扩展 指令 合 在 一 起 共同 组 成 教学 计算 机 完整 的 指令 系统 ,彼此 需要 协调 ,至 


少 彼此 之 间 不 能 有 冲突 。 
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5.4 教学 计算 机 的 汇编 语言 程序 设计 


5.4.1 汇编 语言 及 其 程序 设计 中 的 有 关 概 念 


汇编 语言 大 体 上 是 对 计算 机 机 器 语言 (二 进 制 指令 代码 ) 进 行 符号 化 的 一 种 表示 方式 ， 
每 一 个 基本 汇编 语句 对 应 一 条 机 器 指令 ,在 此 基础 上 ,再 增加 一 些 扩展 功能 ,诸如 支持 系统 
调用 ,允许 定义 和 使 用 宏 (MACRO), 可 以 定义 和 使 用 伪 指 令 等 ,以 便 能 更 方便 地 完成 汇编 
语言 程序 设计 。 在 进行 汇编 语言 程序 设计 时 ,可 以 直接 使 用 英文 单词 或 其 缩写 表示 指令 ,使 
用 标识 符 表示 数据 或 者 地 址 ,有 效 地 避免 了 记忆 二 进 制 的 指令 代码 ,不 再 由 程序 设计 人 员 为 
指令 和 数据 分 配 内 存 地 址 ,直接 调用 操作 系统 的 某 些 程序 段 完成 输入 输出 、 建 立 与 读 写 文件 
等 操作 功能 。 用 编辑 程序 建立 好 的 汇编 语言 源 程序 ,需要 经 过 系统 软件 中 的 汇编 程序 “ 翻 
译 ” 为 机 器 语言 程序 之 后 ,才能 交付 给 计算 机 硬件 系统 去 执行 。 

要 完成 汇编 语言 程序 设计 ,需要 对 程序 结构 中 的 流程 控制 ,实现 这 些 流程 经 常 使 用 的 语 
句 有 个 初步 的 了 解 。 与 用 其 他 语言 设计 的 程序 一 样 ,在 汇编 语言 的 程序 中 ,也 包括 顺序 执 
行 .无 条 件 转移 执行 、 条 件 分 支 执行 ,循环 执行 、 子 程序 调用 与 返回 执行 5 类 程序 结构 ,如 
图 5.17 所 示 。 对 这 5 种 程序 结构 简介 如 下 。 
















































































































1 
指令 / 指令 i | 指令 i 
稍 令 1 令 i+1 | CALA 指 令 
村 指 人 m2 | 指 人 地 
| | 
指令 #2 指令 w+1 | 
指 人 rr4 ] 指令 j3 指 $n | 
1 
指令 1+8 
| 
(a) 顺序 (b) 转移 (c) 分 支 (d) 循环 (e) 子 程序 


图 5.17 5 种 常用 到 的 程序 执行 流程 表示 


(1) 顺序 执行 。 按 照 汇编 语句 (机 器 指令 ) 在 程序 中 排列 的 顺序 从 前 向 后 逐条 执行 ,为 
此 只 需 把 顺序 执行 的 指令 在 程序 中 按 次 序 编写 即 可 。 顺 序 执行 的 指令 所 占 比例 最 高 。 

(2) 无 条 件 转移 执行 。 表 示 需 要 改变 指令 的 执行 次 序 , 下 一 条 将 不 执行 排 在 该 指令 之 
后 的 那 条 指令 ,而 是 用 指令 中 给 出 的 转移 地 址 去 找到 相应 指令 并 执行 ,如 JMPA 和 JR 
指令 。 


(3) 条 件 分 支 执行 。 表 示 需 要 按照 指令 中 指出 的 条 件 为 真 (成 立 ) 还 是 为 假 (不 成 立 )， 
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从 两 条 指令 中 选择 其 一 来 执行 ,条 件 成 立 则 转移 ,不 成 立 则 顺序 执行 ,如 JRC JRNC JRZ、 
JRNZ 指令 。 

(4) 循环 执行 。 是 让 一 段 程序 反复 多 次 地 重复 执行 的 控制 流程 ,直到 达到 需要 重复 执 
行 的 次 数 ,或 者 某 一 个 条 件 出 现时 结束 重复 过 程 。 例 如 ,在 实现 按 次 数控 制 循环 过 程 时 ,可 
以 在 一 个 寄存 器 中 赋 一 个 正 的 初 值 作为 循环 次 数 ,每 循环 一 次 使 该 寄存 器 的 内 容 减 1, 直 到 
该 寄存 器 的 值 变 为 0 则 结束 循环 。 另 一 个 典型 例子 ,在 使 用 串 行 接口 时 ,通过 读 入 接口 状态 
寄存 器 的 内 容 并 判别 某 一 位 的 值 , 以 决定 开始 执行 数据 输入 输出 操作 ,还 是 继续 执行 读 和 人 接 
口 状 态 并 检查 的 循环 过 程 ,控制 循环 执行 可 能 用 到 无 条 件 转移 指令 或 者 条 件 转移 指令 。 

(5) 子 程序 调用 与 返回 执行 。 子 程序 是 通过 子 程序 调用 语句 使 其 投入 运行 过 程 的 一 个 
特殊 的 程度 段 。 教 学 计算 机 中 的 CALA 指令 就 是 子 程序 调用 语句 , 它 的 作用 是 暂停 主 程序 
的 执行 过 程 , 转 去 执行 一 个 子 程序 , 待 子 程序 执行 之 后 ,还 要 返回 来 接着 执行 停 下 来 的 主 程 
序 。 在 子 程序 中 要 用 RET 指令 表明 子 程序 结束 ,以 便 启动 返回 操作 。 

例如 ,对 分 支 结构 ,用 JRC 指令 控制 时 ,如 果 标 志 位 C=1 则 分 支 到 指令 ;十 7, 和 否则 执行 
下 邻 指 令 ;十 2。 

对 循环 结构 ,例如 用 JRZ 指令 控制 时 ,指令 i 十 1.i 十 2 和 JRZ 指令 构成 循环 体 ,JRZ 指 
令 用 于 控制 继续 循环 还 是 结束 循环 。 

对 子 程序 结构 ,例如 在 主 程序 中 用 CALA 指令 调用 由 指令 i 十 j 到 指令 nn( 指 令 n 一 定 
是 RET 指令 ) 组 成 的 子 程序 , 当 子 程序 结束 执行 过 程 后 ,程序 必 将 返回 到 紧 跟 在 CALA 指 
令 之 后 的 指令 i 十 2 处 ,再 次 开始 主 程序 的 执行 过 程 。 


5.4.2 教学 计算 机 的 汇编 程序 设计 举例 


1. 指令 功能 与 在 程序 中 的 作用 

这 里 主要 想 表明 每 个 语句 (每 条 指令 ) 所 完成 的 功能 是 什么 ,在 汇编 程序 中 怎样 组 合 语 
句 实现 一 定 的 运算 处 理 功能 这 样 两 个 方面 的 问题 。 这 对 从 没有 接触 过 汇编 语言 程序 设计 的 
同学 有 启蒙 作用 。 大 部 分 指令 (至 少 是 每 一 类 指令 ) 都 出 现在 下 面 的 例子 中 。 

【 例 5.1】 本 程序 的 功能 是 在 显示 器 屏幕 上 循环 显示 95 个 可 打印 字符 (包括 空格 字符 ) 。 


A 2000 ;从 内 存 的 2000 单 元 开始 建立 用 户 的 第 一 个 程序 
2000: MRD BR, 下 ;向 寄存 器 传送 直接 数 

2002: MRD RO,2 

2004: Or 80 ;通过 串 行 接口 输出 RO 低位 字 节 内 容 到 显示 器 屏幕 
2005: PUSH FO ;保存 BO 寄存 器 的 内 容 到 堆栈 中 

2006: 了 IN 1 ; 读 串 行 接口 的 状态 寄存 器 的 内 容 

2007: SHER FO ;B0 寄 存 器 的 内 容 右 移 一 位 ,最 低位 的 值 移 人 标志 位 c 
2008: JFNC 2006 ;条 件 转 移 指令 , 当 标 志 位 c 不 是 1 时 就 转移 到 2006 地 址 
2009: FOP FO ;从 堆栈 中 恢复 BO 寄存 器 的 原 内 容 

200R: QP FORL ;比较 两 个 寄存 器 的 内 容 是 否 相同 ,相同 则 标志 位 2=1 
200B: JRZ 2000 ;条 件 转移 指令 , 当 标 志 位 2 为 1 时 就 转移 到 2000 地 址 
200C: INC FO ;把 如 寄 存 器 的 内 容 增 加 1 

200E: oR 2004 ;无 条 件 转移 指令 ,一 定 转移 到 2004 地 址 


200F: FET ; 池 程 序 返 回 指令 ,教学 计算 机 的 用 户 程序 也 必须 用 ET 指令 结束 


地 9 斩 
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【 例 5.2】 本 程序 的 功能 是 首先 把 字符 A~F 写 到 内 存 的 2040 一 2045 几 个 单元 ,之 后 
再 读 出 来 并 显示 到 屏幕 上 。 


A 2020 

2020: MED RF3,06 ;给 出 写 内 存 操作 的 次 数 
2022: MEFD PR2,203F 

2024: MFD Rl, 40 


2026: INC BR ;给 出 写 内 存 操作 的 内 存 地 址 

2027: I 也 ;给 出 写 内 存 操作 的 数据 内 容 

2028: SIFR [FE2],RL ; 写 寄存 器 也 的 内 容 到 由 到 指定 地 址 的 内 存单 元 中 
2029: IIEFR RO,[R2] ; 读 出 内 存单 元 的 数据 到 RO 寄存 器 


202R: Or 80 
202B: IN al 
202c: SHER BD 
202D:URNC 202B 


202E: IEC BB ;检查 6 次 写 内 存 操作 是 否 完成 
202F: JRNZ 2026 ;未 完 则 开始 下 一 次 写 内 存 操作 
2030: FET ;程序 结束 


【 例 5.3】 本 程序 的 功能 是 从 键盘 输入 字符 并 送 到 显示 器 屏幕 显示 ,说 明 如 何 使 用 子 
程序 调用 指令 和 转移 指令 。 在 子 程序 中 ,可 以 完成 变 大 写 英文 字母 为 小 写字 母 并 将 其 显示 
出 来 的 功能 。 


A 2040 ;在 该 程序 中 给 出 了 调用 子 程序 和 设计 子 程序 的 例子 





2040: NH 有 1 ;此 处 的 4 个 语句 检查 有 无 敲 击 过 键盘 上 的 一 个 键 
2041: SRR FO 
204: sR FO 
2043: JFNC 2040 
2044: IN 80 ;把 从 键盘 输入 的 一 个 字符 输入 到 Ro 低位 字 节 
2045: OUr 80 ;输出 了 低位 字 节 内 容 到 显示 器 屏幕 
2046: EUSH FO 
20497: IN 时 
2048: SHR BO 
2049: JFNC 2047 
204n: FOP FO 
204B: CAIA 2050 ;调用 子 程序 , 子 程序 的 入 口 地 址 为 2050 
204D: IMEA 2040 ;转移 指令 , 转移 地 址 为 2040 
204n: FET 
; 以 下 是 一 个 子 程序 
2050:MVRD Rl,20 
2051: ADD FO,RL ;修改 输入 的 字符 的 编码 ,可 变 大 写字 母 为 小 写字 母 
2052: Or 80 ;把 修改 过 的 字符 输出 到 显示 器 屏幕 
2053: -FET 浮 程 序 返 回 指令 ,每 个 子 程序 都 应 该 用 RET 结束 


上 面 3 个 程序 使 用 不 同 的 内 存 区 域 ,是 为 了 确保 它们 可 以 同时 存储 在 内 存 中 ,以 便 可 以 
随时 选择 其 一 来 运行 ,彼此 之 间 不 会 有 冲突 。 
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2. 汇编 语言 程序 设计 中 的 有 关 概 念 

1) 教学 计算 机 的 机 器 语言 

教学 计算 机 目前 提供 了 约 50 条 基本 机 器 指令 ,其 中 约 30 条 的 指令 格式 、 功 能 已 完全 确 
定 , 并 已 用 组 合 逻 辑 与 微 程序 两 种 控制 方案 实现 ,可 供用 户 编程 使 用 ; 尚 保留 男 外 约 20 条 的 
指令 交 由 实验 者 自己 去 定义 与 实现 。 

从 计算 机 组 成 原理 课 的 教学 与 实验 的 角度 考虑 ,不 会 要 求学 生 编 写 较 长 的 程序 。 对 一 
些 实验 ,一 般 十 几 行 到 几 十 行 基本 够 用 ,此 时 ,是 可 以 用 机 器 语言 直接 编程 的 。 当 教学 计算 
机 系统 中 没有 接 人 计算 机 终端 (或 PC 仿真 终端 ) 等 输入 输出 设备 时 ,实验 者 只 能 用 开关 向 
计算 机 内 拨 和 人 由 机 器 指令 组 成 的 程序 。 这 种 方式 下 的 操作 与 实验 效率 是 很 低 的 , 我 们 提供 
但 并 不 推荐 这 种 运行 方式 。 

要 用 机 器 语言 写 程序 ,必须 非常 清楚 所 用 机 器 指令 的 格式 ,具体 操作 码 的 编码 ,操作 数 
形式 地 址 的 编码 表示 和 每 条 指令 的 功能 。 我 们 已 在 5. 3. 4 节 以 表格 形式 给 出 这 些 指令 的 机 
器 码 。 

2) 教学 计算 机 的 汇编 语言 

如 何 使 用 16 位 机 系统 的 汇编 语言 ,与 系统 的 硬件 配置 有 关 。 

当 系统 中 不 包括 主要 作为 仿真 终端 使 用 的 PC, 而 是 使 用 计算 机 终端 设备 时 ,就 只 能 使 
用 监控 程序 提供 的 单条 汇编 命令 A, 通 过 计算 机 终端 ,逐条 输入 并 汇编 每 一 个 汇编 语句 ,使 
用 起 来 还 算是 方便 ,缺点 是 不 能 支持 伪 指令 , 即 不 能 使 用 符号 代表 变量 与 汇编 语句 标号 ,一 
般 情 况 下 要 使 用 直接 地 址 ,对 设计 较 小 的 汇编 程序 还 是 可 以 忍受 的 ,对 较 长 一 点 的 汇编 程序 
则 要 困难 一 些 。 具 体操 作 方 法 如 下 。 

(1) 当 教 学 计算 机 系统 加 电 并 正常 启动 起 来 之 后 ,从 键盘 上 输入 监控 程序 的 A 
(ASSEMBLY) 命 令 , 格式 为 : A 跟 一 个 空格 字符 再 跟 指 定 的 内 存 地 址 并 回 车 。 

(2) 接 下 来 , 实验 者 可 逐条 输入 所 要 的 汇编 语句 。 这 种 用 法 与 PC 上 的 DEBUG 很 类 
似 , 系统 会 逐 语句 进行 汇编 ,产生 教学 计算 机 的 指令 代码 ,并 从 给 定 地 址 逐条 连续 存放 。 若 
发 现 给 出 的 汇编 语句 有 错 , 则 指出 错误 位 置 , 并 要 求 重新 输入 正确 的 语句 。 这 个 过 程 一 直 
持续 到 实验 者 在 应 该 输入 语句 的 位 置 不 再 输入 语句 而 直接 按 回 车 键 结束 。 

请 看 下 面 给 出 的 教学 计算 机 的 几 个 汇编 语言 程序 的 例子 。 

【 例 5.4】 设计 一 个 程序 ,在 屏幕 上 输出 显示 一 个 字符 6。 


A 2000 ;地 址 从 十 六 进 制 的 2000( 内 存 RAM 区 的 起 始 地 址 ) 开 始 
2000: MRD 。” RD,0036 ;把 字符 6 的 2scII 码 送 入 RO 

2002: Or 80 ;在 屏幕 上 输出 显示 字符 680 为 串 行 接口 地 址 

2003: FET ;每 个 用 户 程序 都 必须 用 RET 指令 结束 

2004: 忱 回 车 键 即 结束 源 程序 的 输入 过 程 ) 


这 就 建立 了 一 个 从 主 存 2000h 地 址 开始 的 小 程序 。 在 这 种 方式 下 ,所 有 的 数字 都 约定 
使 用 十 六 进 制 数 , 故 数字 后 不 用 跟 字符 h。 每 个 用 户 程序 的 最 后 一 个 语句 一 定 为 RET 汇编 
语句 ,因为 监控 程序 是 选用 类 似 子 程序 调用 方式 使 实验 者 的 程序 投入 运行 的 ,用 户 程序 只 有 
用 RET 语句 结束 ,才能 保证 用 户 程序 运行 结束 时 能 正确 返回 到 监控 程序 的 断 点 ,保证 监控 
程序 能 继续 控制 实验 计算 机 的 运行 过 程 。 

每 一 行 中 第 一 列 的 4 位 十 六 进 制 的 数字 ,是 内 存 地 址 ,其 后 面 那 条 汇编 语句 汇编 出 来 的 
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指令 代码 就 保存 在 由 这 个 地 址 选中 的 存储 单元 中 ;当中 的 部 分 是 汇编 语句 ;分 号 之 后 给 出 的 
是 注释 信息 ,用 于 提高 程序 的 可 读 性 ,对 程序 的 功能 没有 影响 。 
【 例 5. 5】 设计 一 个 程序 ,用 次 数控 制 在 终端 屏幕 上 输出 0 一 9 这 10 个 数字 符 。 


A 2020 
MRD RF2,00m ; 送 入 输出 字符 的 个 数 
MRD 。 RD,0030 ;0 字符 的 zscII 码 
our 80 ;输出 保存 在 低位 字 节 的 字符 
ec EF2 ;输出 字符 个 数 减 1 
2 200E j 浏 别 了 0 个 字符 输出 完 否 ,已 完 , 则 转移 到 程序 结束 处 
FUSH RO ;未 完 ,保存 了 的 值 到 堆栈 中 
(028) IN 81 查询 串 行 接口 状态 , 判 字 符 的 串 行 输 出 过 程 结束 否 
SR RO; 
JENC 2008 ;未 完成 , 则 循环 等 待 
FOP RD 总 完成 ,准备 继续 输出 下 一 字符 ,从 堆栈 恢复 BO 的 值 
IN BO ;得 到 下 一 个 要 输出 的 字符 
mR 2024 ; 转 去 输出 字符 
(202E)RET 


这 个 程序 只 使 用 基本 汇编 语句 。 理 解 中 的 一 个 难点 ,是 程序 当中 判别 串 行 口 是 否 完成 
一 个 字符 的 输出 过 程 并 循环 等 待 的 3 个 汇编 语句 。 具 体 解 释 见 教材 中 有 关 串 行 接口 的 
内 容 。 

该 程序 的 执行 码 保存 在 2020 起 始 的 内 存 区 中 。 若 送 入 源码 的 过 程 中 有 错 ,系统 会 进行 
提示 ,等 待 重新 输入 正确 语句 。 输 入 过 程 中 ,在 应 输入 语句 的 位 置 直接 按 回 车 则 结束 输入 

接 下 来 可 用 G 2020 命令 运行 该 程序 。 

思考 题 : 当 把 IN 81,SHR R0,JRNC 2028 这 3 个 语句 换 成 3 个 MVRR R0,R0 语句 ， 
该 程序 执行 过 程 会 出 现 什么 现象 ? 试 分 析 并 实际 执行 一 次 。 

类 似 地 , 若 要 求 在 终端 屏幕 上 输出 A 一 Z 共 26 个 英文 字母 ,应 如 何 修改 本 例 中 给 出 的 


程序 ? 请 验证 。 
【 例 5. 6】 从 键盘 上 连续 输入 多 个 属于 0 一 9 的 数字 符 并 在 屏幕 上 显示 , 遇 非 数字 符 结 
东 程 序 。 
从 地 址 2040 开始 输入 下 列 程序 。 
A 2040 
MED F2,0030 ;用 于 判别 数字 符 的 下 界 值 
MED R3,0039 ;用 于 判别 数字 符 的 上 界 值 
(2044) IN 91 ;j 浏 别 键 盘 上 是 否 按 了 一 个 键 
SHR BO ; 即 串 行 口 是 否 有 了 输入 的 字符 
sR BO 
JRNE 2044 ; 尚 没有 输入 则 循环 测试 
WH 80 ;把 输入 字符 读 到 RO 低位 字 节 


AD RORL ;将 色 的 高 位 字 节 清 0 
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QP RR ; 浏 别 输入 的 字符 是 否 < 字符 0 ge 
JENC 2053 ;是 , 则 转 到 程序 结束 处 章 
CMP B,D ; 浏 别 输入 的 字符 是 否 > 字 符 9 
JRNC 2053 ;是 , 则 转 到 程序 结束 处 
Ur 80 ;输出 刚 输入 的 数字 符 
MEA 2044 ; 转 去 程序 前 边 2044 处 等 待 输入 下 一 个 字符 

(2053)RET 


思考 题 ,本 程序 中 为 什么 不 必 判 别 串 行 口 输出 完成 否 ? 设计 读 入 A~Z 和 0 一 9 的 程 
序 , 遇 其 他 字符 结束 输入 过 程 。 
【 例 5.7】 计算 1 一 10 的 累加 和 。 


及 2060 
MEFD Rl,0000 ; 置 累加 和 的 初 值 为 0 
MEFD F2,000m ;最 大 的 加 数 
SB FSR3 ; 预 置 参 加 累加 的 数 为 0 
(2064) IN BB ;得 到 下 一 个 参加 累加 的 数 
AD RL,F3 ;累加 计算 
QP 3,R 浏 别 是 否 累加 完 
JFNZ 2065 ;未 完 ,开始 下 一 轮 累加 
FET 


运行 过 后 ,可 以 用 R 命令 看 Rl1 中 的 累加 结果 。 
【 例 5.8】 设计 一 个 有 读 写 内 存 和 子 程序 调用 指令 的 程序 ,功能 是 读 出 指定 内 存 中 的 
大 写字 母 字符 ,将 其 显示 到 屏幕 上 ,转换 为 小 写字 母后 再 写 回 存储 器 的 原 存 储 单元 。 


E20F0 ; 送 入 将 被 显示 的 6 个 字符 zz 到 内 存 30 开始 的 存储 区 域 中 
4142 43 44 45 46 


MED F3, 0006 ;指定 被 读数 据 的 个 数 
MED Fo, 20F0 ;指定 被 读 、 写 数据 内 存 区 首 地 址 


(2084) IIFR FO, [FQ] ; 读 内 存 中 的 一 个 字符 到 8 寄存 器 
CRIR 2100 ;调用 子 程序 ,入 口 地 址 为 2100, 完 成 显示 ,字符 转换 和 写 回 内 存 的 
功能 
IEC BR3 ;检查 输出 的 字符 个 数 
az 208c ;完成 输出 则 结束 程序 的 执行 过 程 
mc 了 ;未 完成 ,修改 内 存 地 址 
R2084 ;转移 到 程序 的 2084 处 ,循环 执行 规定 的 处 理 
FRET 
A2100 ;输入 用 到 的 子 程序 到 内 存 200 开 始 的 存储 区 
Ur 80 ;输出 保存 在 了 寄存 器 中 的 字符 
MED Rl, 0020 ;转换 保存 在 8 中 的 大 写字 母 为 小 写字 母 
AD RO, Rl 
SEHR [FR], RD ; 写 中 的 字符 到 内 存 , 地 址 同 IFR 所 用 的 地 址 


(2105) IH a ;测试 串 行 接口 是 否 完成 输出 过 程 
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SHR BD 
IFNC 2105 ;未 完成 输出 过 程 则 循环 测试 
FET ;结束 子 程 序 执行 过 程 ,返回 主 程序 


运行 过 程 中 ,可 以 直接 看 到 屏幕 上 显示 的 内 容 ,运行 过 后 ,再 用 D 20F0 命令 看 内 存 的 
20F0 区 域 中 保存 的 运行 结果 ,6 个 大 写 的 英文 字母 已 经 被 修改 为 小 写字 母 ; 


0061 0062 0063 0064 0065 0066 


例 5. 4 一 例 5. 8 中 ,都 是 用 监控 程序 的 A 命令 完成 输入 源 汇编 程序 的 。 在 涉及 汇编 语 
句 标号 的 地 方 ,不 能 用 符号 表示 ,只 能 在 指令 中 使 用 直接 地 址 。 使 用 内 存 中 的 数据 ,也 由 程 
序 员 给 出 数据 在 内 存 中 的 直接 地 址 。 显 而 易 见 ,对 这 样 的 短小 程序 矛盾 并 不 突出 , 当 设计 较 
长 的 程序 时 ,一 定 会 遇 到 相当 大 的 困难 。 

在 用 A 命令 输入 汇编 源 语句 的 过 程 中 ,有 一 定 使 用 经 验 的 人 ,常常 抱怨 A 命令 中 未 提 
供 适当 的 编辑 功能 ,这 并 不 是 设计 者 的 玻 漏 。 因 为 我 们 并 不 准备 在 这 种 操作 方式 下 支持 设 
计较 长 的 程序 ,例如 输入 上 述 一 些小 程序 ,用 监控 程序 的 A 命令 完成 ,往往 比 用 交叉 汇编 完 
成 更 方便 。 相 反 的 情况 是 , 若 真 的 要 设计 较 长 的 程序 ,就 需要 转 到 提供 了 交叉 汇编 程序 的 
PC 上 去 完成 。 例 如 ,教学 计算 机 的 监控 程序 ,就 是 通过 PC 的 编辑 程序 建立 源 代码 ,用 运行 
在 PC 中 的 交叉 汇编 程序 完成 汇编 操作 ,从 而 得 到 由 教学 计算 机 的 指令 构成 的 执行 程序 的 
代码 。 在 把 得 到 的 监控 程序 的 执行 码 编程 到 教学 计算 机 的 ROM 存储 芯片 之 后 ,教学 计算 
机 就 有 了 自己 的 监控 程序 。 

3) 教学 计算 机 的 交叉 汇编 程序 

交叉 汇编 的 概念 是 用 运行 在 另外 一 台 计 算 机 (例如 PC) 中 的 程序 ,完成 对 本 台 计 算 机 
(例如 教学 计算 机 ?的 汇编 语言 的 源 程序 执行 汇编 操作 ,并 产生 本 台 计 算 机 (例如 教学 计算 
机 ) 的 执行 程序 的 指令 代码 。 显 而 易 见 ,这 是 一 种 借 鸡 哼 蛋 的 策略 。 采 取 这 种 办 法 有 2 个 理 
由 。 一 是 基于 教学 计算 机 的 可 用 资源 非常 有 限 , 相 比 之 下 ,作为 教学 计算 机 仿真 终端 使 用 的 
PC 的 资源 和 功能 实在 是 太 强 大 了 .何不 借用 一 下 呢 ? 二 是 在 教学 计算 机 系统 可 以 正常 运 
行 之 前 ,新 设计 的 ,未 经 考验 的 硬件 系统 ,与 未 完全 设计 好 、 又 急于 用 于 调试 整 机 系统 的 监控 
程序 撞 到 了 一 起 ,两 个 方面 反 反复 复 地 修改 是 难免 的 ,此 时 真 的 很 难 直接 在 教学 计算 机 上 实 
现 一 个 自己 的 汇编 程序 ,只 能 借助 PC 帮忙 了 。 因 此 也 可 以 说 ,在 PC 上 实现 用 于 教学 计算 
机 的 交叉 汇编 程序 ,是 研制 开发 教学 计算 机 的 一 个 过 程 性 产品 ,原意 是 用 于 开发 教学 计算 机 
的 监控 程序 ,后 来 作为 已 有 成 果 继 续 使 用 下 来 。 事 实 上 .在 教学 计算 机 上 ,用 该 计算 机 的 指 
令 系 统 , 开 发 一 个 汇编 程序 是 一 项 比较 容易 的 工作 ,监控 程序 可 以 为 此 提供 足够 的 子 程序 ， 
硬件 系统 也 可 以 支持 充足 的 内 存 空 间 . 只 是 尚 无 暇 顾及 此 事 。 在 交叉 汇编 程序 中 ,提供 了 汇 
编程 序 中 那些 最 常用 的 基本 功能 .提供 了 最 常用 的 伪 指 令 , 例 如 ,说明 变量 、 常 量 ,分 析 与 处 
理 简单 的 表达 式 , 保 留存 储 区 域 , 允 许 指明 程序 的 起 始 地 址 和 结束 地 址 ,允许 使 用 语句 标号 
等 ,这 就 为 设计 较 长 的 汇编 语言 的 程序 提供 了 必要 的 支持 。 换 言 之 ,可 以 用 比较 正规 的 办 法 
来 设计 教学 计算 机 的 汇编 语言 程序 ,最 典型 的 实例 就 是 教学 计算 机 监控 程序 的 源 程序 代码 。 
交叉 汇编 程序 有 用 PC 汇编 语言 实现 ,用 C 语言 实现 和 用 PASCAL 语言 实现 的 3 个 不 同 的 
版 本 ,可 读 性 都 比较 好 ,扩展 与 修改 功能 更 方便 容易 ,是 学 习 和 理解 汇编 程序 本 身 的 设计 与 
实现 的 良好 技术 资料 。 
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4) 教学 计算 机 的 高 级 语言 和 浮 点 数 运算 

在 此 之 外 ,我 们 又 在 教学 计算 机 上 ,用 教学 计算 机 的 指令 系统 设计 了 BASIC 语言 的 解 
释 执行 程序 ,从 而 实现 了 用 软件 方法 支持 的 浮 点 数据 运算 ,实现 了 真正 意义 上 的 表达 式 分 
析 ,实现 了 函数 调用 等 功能 ,使 主要 用 于 教学 实验 的 计算 机 有 了 运行 高 级 语言 程序 的 能 力 。 
这 个 BASIC 语言 的 解释 执行 程序 中 含有 比较 多 的 知识 量 (这 里 的 一 些 知识 超出 了 本 教材 的 
教学 要 求 ), 其 源 程序 代码 是 值得 读 一 读 的 ,当然 这 需要 花费 一 定 的 时 间 和 精力 。 对 有 兴趣 
的 师 生 ,特别 应 该 关注 实现 浮 点 数据 运算 的 部 分 。 事 实 上 ,可 以 比较 方便 地 通过 调用 
BASIC 解释 程序 中 的 子 程序 ,在 教学 计算 机 原 有 指令 系统 中 加 进 浮 点 数 运算 的 指令 , 进 一 
步 提高 教学 计算 机 的 运算 能 力 , 这 也 是 更 深入 地 学 习 与 理解 浮 点 数 运算 规则 、 执 行 步骤 的 有 
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本 章 介绍 设计 计算 机 指令 系统 的 基本 标准 ,强调 了 一 套 好 的 指令 系统 对 计算 机 厂家 和 
用 户 都 是 至 关 重 要 的 。 本 章 以 教学 计算 机 指令 系统 作为 重点 例子 ,详细 地 讲解 了 指令 的 功 
能 安排 .指令 格式 、 寻 址 方式 选择 3 方面 的 知识 。 作 为 指令 系统 的 实际 例子 ,简单 地 列 出 了 
Pentium 下 计算 机 `MIPS 计算 机 和 PDP-11 计算 机 的 基本 指令 的 构成 概貌 ,鼓励 读者 对 比 
这 几 个 指令 系统 在 指令 格式 、 寻 址 方式 、 指 令 构成 等 方面 的 特点 和 差异 。 

作为 本 课程 的 教学 要 求 ,汇编 语言 程序 设计 应 该 占有 一 定 的 分 量 , 这 更 需要 结合 实际 的 
指令 系统 来 进行 ,教学 计算 机 为 此 提供 了 必要 的 支持 ,把 学 习 计 算 机 组 成 与 汇编 语言 程序 设 
计 两 项 内 容 有 效 地 结合 起 来 是 值得 提倡 的 。 

比较 好 地 熟悉 了 一 套 指令 系统 ,再 将 其 在 自己 设计 的 CPU 系统 中 实现 出 来 ,能 够 运行 
自己 设计 的 汇编 程序 ,将 学 习 到 更 多 实用 的 知识 和 技术 ,可 以 体验 学 习 的 乐趣 ,享受 成 功 后 
的 喜悦 ,醉人 的 成 就 感 将 成 为 推动 人 们 勇往直前 的 强力 发 动机 。 需 要 指出 ,规划 .设计 指令 
系统 通常 很 难 由 计算 机 硬件 人 员 完 成 ,而 把 这 套 指令 系统 的 功能 在 硬件 系统 上 合理 、 高 效 地 
实现 出 来 则 是 硬件 人 员 的 重要 任务 。 





习题 与 思考 题 
1. 计算 机 硬件 能 直接 识别 和 运行 的 只 能 是 程序 。 
A. 机 器 语言 B. 汇编 语言 C. 高 级 语言 D. VEDL 
2. 机 器 语言 是 面向 的 ,用 它 写 的 程序 在 不 同 计算 机 之 间 移 植 。 
A. 计算 机 硬件 B. 软件 算法 C. 容易 D. 难以 
3. 指令 中 用 到 的 数据 可 以 来 自 。( 可 多 选 ) 
A. 通用 寄存 器 B. 微 程序 存储 器 ” C. 输入 输出 接口 D. 指令 寄存 器 
E. 内 存单 元 F. 磁盘 
4. 汇编 语言 要 经 过 的 翻译 才能 在 计算 机 中 执行 。 
A. 编译 程序 B. 数据 库 管 理 程序 C. 汇编 器 程序 D. 文字 处 理 程 序 


5. 在 设计 指令 操作 码 时 要 做 到 。( 可 多 选 ) 
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6. 

《得 
(2 
(3 
(4 
(5 
(6 
(7 
下 


A. 能 区 别 一 套 指令 系统 中 的 所 有 指令 ”B. 能 表明 操作 数 的 地 址 
C. 长 度 随 意 确定 D. 长 度 适当 规范 统一 
判断 题 ,指出 下 面 各 题 的 对 错 ,并 简单 说 明理 由 。 

) 寄存 器 寻 址 在 指令 中 所 占 位 数 比较 少 ,特别 常用 。 

) 直接 寻 址 在 指令 中 所 占 位 数 比较 少 ,特别 常用 。 

) 变 址 寻 址 需要 在 指令 中 提供 一 个 寄存 器 编号 和 一 个 数值 。 

) 相对 寻 址 需要 在 指令 中 提供 一 个 寄存 器 编号 和 一 个 数值 。 

) 堆栈 寻 址 不 是 很 有 用 。 

) 指令 的 字 长 度 对 计算 机 的 性 能 有 较 大 影响 。 

) 计算 机 的 指令 越 多 .功能 越 强 越 好 。 

某 机 器 字 长 16 位 , 主 存 按 字 节 编 址 ,转移 指令 采用 相对 寻 址 ,由 两 个 字 节 组 成 ,第 一 


字 节 为 操作 码 字 段 , 第 二 字 节 为 相对 位 移 量 字 段 。 假 定 取 指 令 时 ,每 取 一 个 字 节 PC 自动 加 
1。 若 某 转 移 指令 所 在 主 存 地 址 为 2000H, 相 对 位 移 量 字段 的 内 容 为 06H, 则 该 转移 指令 成 
功 转移 后 的 目标 地 址 是 。 


8. 


A. 2006H B. 2007H C. 2008H D. 2009H 
一 条 指令 通常 由 哪 两 个 部 分 组 成 指令 的 操作 码 一 般 有 哪 几 种 组 织 方式 ? 各自 应 


用 在 什么 场合 ? 各 自 的 优 缺 点 是 什么 ? 


证 
> 


9. 
10 


? 如 


11 


如 何在 指令 中 表示 操作 数 的 地 址 ? 通常 使 用 哪些 基本 寻 址 方式 ? 
.什么 是 形式 地 址 ?” 简 述 对 变 址 寻 址 、 相 对 寻 址 、 基 地 址 寻 址 应 在 指令 中 给 出 什么 信 
何 得 到 相应 的 实际 (有 效 ) 地 址 ? 各 自 有 什么 样 的 主要 用 法 ? 
. 下列 关于 RISC 的 叙述 中 ,错误 的 是 。 
A. RISC 普遍 采用 微 程序 控制 器 
B. RISC 大 多 数 指令 在 一 个 时 钟 周 期 内 完成 
C. RISC 的 内 部 通用 寄存 器 数量 相对 CISC 多 
D. RISC 的 指令 数 、 寻 址 方式 和 指令 格式 种 类 相对 CISC 少 
.下 列 给 出 的 指令 系统 特点 中 ,有 利于 实现 指令 流水 的 是 
.指令 格式 规整 且 长 度 一 致 上 .指令 和 数据 按 边界 对 齐 存 放 
.只 有 Load/Store 指令 才能 对 操作 数 进行 存储 访问 
A. 仅 I、I B. 仅 工 下 Cc: 仪 x D. I I、 
. 堆栈 的 主要 作用 是 什么 ”如 何 完 成 读 写 堆栈 的 操作 ? 
.寄存 器 寻 址 和 寄存 器 间接 寻 址 的 区 别 是 什么 ? 
. 偏 移 寻 址 通过 将 某 个 寄存 器 的 内 容 与 一 个 形式 地 址 相 加 而 生成 有 效 地 址 。 下 列 寻 


址 方式 中 ,不 属于 偏 移 寻 址 方式 的 是 上 


16 
17 
18 


A. 间接 寻 址 B. 基 址 寻 址 C. 相对 寻 址 D. 变 址 寻 址 
. 为 读 写 输入 /输出 设备 ,通常 有 哪 几 种 常用 的 方式 用 以 指定 被 读 写 设备 ? 
. MIPS16e 计算 机 的 指令 系统 与 RISC 计算 机 的 指令 系统 有 哪些 类 同 的 方面 ? 
.用 教学 计算 机 的 指令 系统 ,设计 一 个 程序 ,实现 从 键盘 读 入 无 符号 的 整 型 数据 ,到 


计算 机 内 转换 成 二 进 制 数 并 保存 在 累加 器 RO 中 ,要 求 有 适当 的 检查 各 种 操作 错误 的 能 力 。 


9 


.用 教学 计算 机 的 指令 系统 ,设计 一 个 程序 ,实现 从 键盘 读 入 有 符号 的 整 型 数据 ,到 


项 会 系统 和 汇编 语言 程序 设计 





计算 机 内 转换 成 补 码 形式 的 二 进 制 数 并 保存 在 累加 器 R0 中, 要求 有 适当 的 检查 各 种 操作 
错误 的 能 力 ,例如 输入 了 非法 字符 .数值 溢出 等 。 

20. 用 教学 计算 机 的 指令 系统 ,设计 一 个 程序 ,实现 2 个 无 符号 的 整数 相 乘 运算 的 
功能 。 

21. 说 明 CISC 和 RISC 两 种 指令 系统 各 自 追 求 的 目标 .特点 以 及 对 计算 机 硬件 系统 构 
成 方面 的 影响 ,人 们 在 说 到 指令 系统 时 , 常 提 到 的 80% 和 20% 是 什么 含义 ? 

22. 建立 有 关 指 令 、 指 令 系 统 、RISC、CISC 指令 格式 、 指 令 操 作 码 、 指 令 操作 数 地 址 、 形 
式 地 址 ,物理 (实际 ) 地 址 的 概念 。 

23. 理解 寻 址 方式 、 寄 存 器 编 址 、 存 储 器 单元 编 址 .IO 端口 地 址 、 指 令 周 期 .执行 步骤 的 
基本 概念 。 

24. 了 解 机 器 语言 、 汇 编 语 言 ,汇编 语言 程序 设计 、 高 级 语言 .程序 执行 流程 ,指令 顺序 
执行 .转移 执行 . 子 程序 调用 与 返回 的 含义 。 
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于 
控制 器 部 件 


控制 器 部 件 是 计算 机 的 5 大 功能 部 件 之 一 。 其 作用 是 向 整 机 每 个 部 件 ( 包 括 控制 器 部 
件 本 身 ) 提 供 它 们 协同 运行 所 需要 的 控制 信号 ,以 确保 计算 机 硬件 系统 能 连续 ,自动 地 执行 
每 一 条 指令 ,也 就 是 执行 程序 。 为 了 学 懂 控 制 器 部 件 ,需要 掌握 计算 机 各 功能 部 件 组 成 和 它 
们 的 连接 方式 ,能 够 理解 各 类 信息 在 不 同时 间 里 、 在 计算 机 各 功能 部 件 之 间 的 保存 和 流动 的 
时 间 空 间 关 系 , 如 何 划 分 指令 的 执行 步 又、 怎样 处 理 执行 步 又 之 间 的 衔接 次 序 、 确 定 每 一 个 
步 又 实现 的 功能 是 学 习 的 重点 内 容 。 

控制 器 包括 硬 布线 控制 器 和 微 程序 控制 器 两 类 ,本 章 重 点 讲授 计算 机 控制 器 的 功能 、 组 
成 与 实现 。 将 以 指令 的 执行 过 程 ( 步 又 ?为 主线 索 , 把 通用 原理 性 知识 与 真实 计算 机 控制 器 
实例 相 结合 ,以 硬 布线 方案 的 控制 器 为 主 ,并 简单 介绍 微 程 序 控制 器 的 基础 知识 。 


6.1 控制 器 的 功能 与 组 成 概述 


计算 机 硬件 系统 通常 由 运算 器 部 件 .控制 器 部 件 .存储 器 系统 .输入 设备 和 输出 设备 这 
5 大 部 分 组 成 。 作 为 5 大 功能 部 件 之 一 的 控制 器 的 作用 ,是 向 整 机 系统 的 每 个 部 件 (包括 控 
制 器 部 件 本 身 ) 提 供 它 们 协同 运行 所 需要 的 控制 信号 。 计 算 机 的 核心 功能 是 提供 连续 执行 
指令 的 能 力 , 而 每 一 条 指令 往往 又 要 分 成 几 个 执行 步骤 才 得 以 完成 。 由 此 又 可 以 说 ,计算 机 
控制 器 的 基本 功能 ,是 依据 当前 正在 执行 的 指令 和 它 所 处 的 执行 步骤 ,形成 并 提供 出 在 这 一 
时 刻 整 机 各 部 件 要 用 到 的 控制 信号 ,这 些 控制 信号 是 由 各 个 部 件 的 组 成 和 运行 要 求 决定 的 。 

执行 一 条 指令 ,通常 总 是 要 经 过 读 取 指令 、 分 析 指 令 .执行 指令 所 规定 的 处 理 功能 这 3 
个 阶段 才能 完成 ,这 是 在 控制 器 的 控制 下 实现 的 。 控 制 器 还 要 保证 计算 机 能 按 程序 中 设 定 
的 指令 运行 次 序 ,自动 地 连续 执行 指令 序列 。 为 此 ,控制 器 部 件 必 须 由 几 个 具有 不 同 处 理 功 
能 的 子 部 件 组 成 .图 6.1 给 出 了 控制 器 的 基本 组 成 .并 且 表 明 它 在 整 机 中 的 地 位 。 

从 图 6. 1 可 以 看 到 计算 机 硬件 系统 的 5 大 功能 部 件 及 其 连接 关系 。 虚 线 框 内 的 是 控制 
器 部 件 , 承 担 的 是 指挥 .控制 整个 硬件 系统 的 各 个 部 件 协同 运行 的 任务 。 另 外 的 4 个 实 线 框 
是 4 个 执行 部 件 , 各 自 执行 特定 的 功能 ,运算 器 执行 数据 运算 ,内 存储 器 存储 正在 使 用 的 程 
序 和 相应 数据 ,输入 设备 用 于 从 主机 系统 的 外 部 向 主机 内 送 入 信息 .输出 设备 用 于 输出 主机 
内 部 信息 。 这 5 个 功能 部 件 通过 数据 总 线 、 地 址 总 线 和 控制 总 线 连接 在 一 起 ,主要 连接 关系 
简单 说 明 如 下 。 





挫 制 器 部 件 
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图 6.1 控制 器 组 成 与 其 在 整 机 中 的 地 位 
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(1) 运算 器 部 件 通 过 数据 总 线 和 内 存储 器 、 输 入 设备 和 输出 设备 传送 数据 。 

(2) 输入 和 输出 设备 通过 接口 电路 与 总 线 相连 接 , 进 而 接 人 主机 系统 。 

(3) 内 存储 器 、 输 入 设备 和 输出 设备 从 地 址 总 线 接收 地 址 信息 ,从 控制 总 线 得 到 控制 信 
号 ,通过 数据 总 线 与 其 他 部 件 传送 数据 。 

(4) 控制 器 部 件 从 数据 总 线 接收 指令 信息 ,从 运算 器 部 件 接收 指令 转移 地 址 ,送出 指令 
地 址 到 地 址 总 线 。 

(5) 控制 器 还 要 向 系统 中 各 部 件 提供 它们 运行 所 需要 的 控制 信号 ,通常 是 通过 控制 总 
线 向 接口 芯片 ,内存 芯片 提供 控制 信号 。 提 供给 运算 器 的 控制 信号 是 直接 传送 的 。 

图 6.1 中 给 出 了 组 成 控制 器 的 4 个 基本 子 部 件 , 它 们 分 别 如 下 。 

(1) 程序 计数 器 (PC) ,用 于 提供 指令 在 内 存 中 的 地 址 的 部 件 , 服 务 于 读 取 指 令 ,能 执行 
内 容 增 量 和 接收 新 的 指令 地 址 ,解决 的 是 指令 执行 的 次 序 问题 。 

(2) 指令 寄存 器 (IR) ,用 于 接收 并 保存 从 内 存储 器 读 出 来 的 指令 内 容 的 部 件 , 在 执行 本 
条 指令 的 整个 过 程 中 ,为 系统 运行 提供 指令 本 身 的 主要 信息 ,作为 指令 执行 步骤 和 完成 功能 
的 基本 依据 。 

(3) 指令 执行 的 步骤 标记 线路 ,用 于 标记 出 每 条 指令 的 各 个 执行 步骤 的 相对 次 序 关 系 ， 
解决 的 是 每 一 条 指令 各 步骤 的 转换 和 衔接 关系 问题 。 

(4) 全 部 控制 信号 的 产生 部 件 , 它 依据 指令 操作 码 、 指 令 的 执行 步骤 (时 刻 ) ,也许 还 有 
些 另 外 的 条 件 信号 ,来 形成 或 提供 出 在 指令 的 当前 执行 步骤 下 计算 机 各 个 部 件 要 用 到 的 控 
制 信号 。 计 算 机 整 机 各 个 执行 部 件 正 是 在 这 些 信 号 控制 下 协同 运行 ,完成 指令 的 执行 功能 ， 
产生 程序 正确 的 执行 结果 。 

在 计算 机 正常 执行 指令 的 过 程 中 .还 要 能 够 及 时 响应 和 处 理 一 些 随时 可 能 出 现 的 紧急 
事件 ,例如 计算 机 运行 遇 到 错误 或 故障 .设备 请 求 传送 或 接收 数据 .网 上 有 信息 送 过 来 ` 由 计 
算 机 实时 控制 的 一 个 系统 请 求 计算 机 立刻 干预 它 的 运行 状态 等 ,这 些 通 常 是 以 硬件 或 软件 
中 断 方式 表现 出 来 并 进行 处 理 的 ,这 些 内 容 不 在 这 里 讲解 ,将 其 放 到 第 11 章 再 详细 说 明 , 以 
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使 首先 把 主要 精力 聚焦 到 指令 本 身 的 执行 过 程 。 

依据 前 述 控制 器 最 后 两 个 组 成 部 分 的 具体 组 成 与 运行 原理 不 同 ,通常 把 控制 器 区 分 为 
硬 布线 控制 器 和 微 程序 控制 器 两 大 类 。 本 书 分 别 介 绍 了 这 两 种 控制 器 ,具体 实例 选 自 用 于 
教学 实践 的 教学 计算 机 系统 ,最 大 限度 地 把 课堂 授课 和 教学 实验 联系 在 一 起 。 


6.2 硬 布线 控制 器 


硬 布线 控制 器 ,又 称 为 组 合 逻辑 控制 器 ,与 微 程序 控制 器 共同 构成 计算 机 通用 的 两 大 类 
控制 器 。 硬 布线 控制 器 是 早期 计算 机 唯一 可 用 的 方案 ,当前 在 RISC 结构 的 计算 机 、 追 求 特 
高 性 能 的 计算 机 中 也 被 普遍 选用 。 它 的 基本 运行 原理 ,是 使 用 大 量 的 组 合 逻 辑 门 线路 ,直接 
提供 出 控制 计算 机 各 功能 部 件 协同 运行 所 需要 的 控制 信和 号。 这 些 门 电路 的 输入 信号 是 指令 
操作 人 码 .指令 执行 步 又 编码 ,或 许 还 有 其 他 的 控制 条 件 ,输出 信号 就 是 提供 给 计算 机 各 功能 
部 件 的 控制 信号 。 其 优点 是 ,形成 这 些 控制 信号 所 必需 的 信号 传输 延迟 时 间 短 ,有 利于 提高 
系统 运行 的 速度 。 其 缺点 是 ,形成 控制 信号 的 电路 设计 比较 复杂 ,再 用 与 或 , 非 等 组 合 逻 辑 
门 电路 把 设计 结果 实现 出 来 也 相对 烦琐 ,尤其 是 要 变动 一 些 设计 时 不 大 方便 。 随 着 大 ( 超 
大 ) 规 模 集成 电路 的 发 展 , 特 别 是 各 种 不 同类 型 的 现场 可 编程 器 件 的 出 现 , 性 能 杰出 的 辅助 
设计 软件 的 应 用 ,这 一 矛盾 已 在 很 大 程度 上 得 到 缓解 。 


6.2.1 硬 布 线 控 制 器 的 组 成 和 运行 原理 简介 


硬 布线 控制 器 的 基本 组 成 如 图 6.2 所 示 , 由 图 可 见 , 它 与 图 6. 1 中 的 内 容 是 一 致 的 , 程 
序 计数 器 (PC) .指令 寄存 器 (IR) 都 保持 不 变 , 只 是 指令 执行 步骤 标记 线路 明确 为 节拍 发 生 
器 (Timing) ,控制 信号 产生 或 保存 电路 明确 为 控制 信号 产生 部 件 (CU ) 。 
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图 6.2 硬 布线 控制 器 的 组 成 


可 以 从 以 下 几 个 方面 来 理解 硬 布线 控制 器 的 运行 原理 。 

首先 ,从 计算 机 执行 程序 的 层次 考虑 。 程 序 是 机 器 指令 的 一 个 序列 ,因此 ,计算 机 硬件 
应 能 自动 地 .连续 地 执行 程序 中 的 每 一 条 指令 ,核心 问题 在 于 应 依据 指令 的 执行 次 序 , 自 动 
地 逐条 从 内 存储 器 读 来 每 一 条 指令 ,接着 分 析 和 执行 这 条 指令 ,程序 计数 器 (PC) 在 这 一 过 
程 中 起 到 关键 作用 。 它 保存 一 条 指令 在 内 存 中 的 地 址 ,服务 于 到 内 存 中 读 取 指 令 。 它 的 自 
行 增 量 功能 用 于 形成 相 邻 的 下 一 条 指令 的 地 址 ,解决 的 是 指令 的 顺序 执行 需求 ,而 通过 接收 
新 的 指令 (例如 转移 指令 ) 的 地 址 来 改变 指令 的 执行 顺序 ,解决 的 是 变更 指令 执行 流程 ( 非 顺 
序 执行 ) 的 需求 ,这 两 种 办 法 确保 计算 机 能 自动 地 ,连续 地 执行 程序 中 的 每 一 条 指令 。 


挫 制 器 部 件 


从 内 存储 器 读 出 来 的 指令 内 容 将 经 过 数据 总 线 传送 到 指令 寄存 器 (IR) ,以便 在 这 条 指 
令 执行 的 整个 过 程 中 ,由 IR 来 提供 这 条 指令 的 主要 内 容 ( 指 令 操 作 码 和 形式 地 址 等 ) 。 

其 次 ,从 计算 机 执行 一 条 指令 的 层次 考虑 。 每 条 指令 都 是 在 取 指 、 分 析 、 执 行 的 循环 中 
完成 的 , 即 执行 每 一 条 指令 ,通常 都 要 经 过 读 取 指令 ,分 析 指 令 、 执 行 这 条 指令 规定 的 具体 操 
作 功 能 等 几 个 操作 步 又。 设计 硬 布线 控制 器 或 微 程 序 控制 器 ,都 要 经 过 如 下 几 个 步骤 。 

(1) 熟悉 需要 实现 的 每 一 条 指令 的 功能 和 格式 ,了 解 完 整 的 指令 系统 。 

(2) 划分 每 一 条 指令 的 执行 步骤 ,把 每 一 条 指令 的 完整 功能 拆 分 到 对 应 指令 的 每 一 个 
执行 步骤 中 去 ,确定 这 一 步骤 会 用 到 哪些 部 件 的 什么 功能 。 

(3) 确定 在 实现 这 些 操作 功能 时 ,计算 机 各 功能 部 件 要 求 使 用 哪些 控制 信号 。 

(4) 需要 选用 什么 具体 逻辑 线路 ,采用 什么 处 理 方案 ,来 分 步骤 地 形成 并 向 计算 机 各 功 
能 部 件 提供 出 这 些 控制 信号 。 

在 完成 划分 指令 执行 步骤 的 设计 之 后 ,需要 有 办 法 区 分 .表示 这 些 执行 步骤 。 在 硬 布线 
控制 器 中 ,使 用 节拍 发 生 器 (Timing) 来 区 分 指令 不 同 的 执行 步 又。 它 是 由 几 个 触发 器 电路 
实现 的 典型 的 时 序 逻 辑 电路 ,提供 指令 每 一 个 执行 步骤 的 节拍 状态 信号 ,用 节拍 状态 变换 来 
标明 一 条 指令 的 执行 步骤 的 次 序 关 系 。 

在 确定 计算 机 各 功能 部 件 要 求 使 用 哪些 控制 信号 时 ,依据 的 是 这 些 需 要 控制 的 功能 部 
件 本 身 的 组 成 和 运行 的 控制 需求 。 例 如 ,要 控制 第 4 章 讲 过 的 运算 器 完成 某 种 运算 功能 ,就 
得 向 其 提供 它 所 要 求 的 几 组 多 位 的 控制 信号 ; 对 硬 布线 的 控制 器 方案 ,就 必须 选用 组 合 逻 辑 
的 门 线路 来 形成 并 提供 出 全 部 的 时 序 控制 信号 ,这 是 由 控制 信号 形成 部 件 (CU) 承 担 的 。 它 
依据 正 处 在 执行 过 程 中 的 指令 的 操作 码 (保存 在 指令 寄存 器 IR 中 ) ,当前 指令 所 处 的 执行 
步 又 (由 节拍 发 生 器 的 节拍 状态 标记 ) 和 某 个 ( 些 ) 判 别 条 件 ( 例 如 ALU 运算 结果 是 否 为 0) 
等 作为 输入 信号 ,用 与 一 或 两 级 组 合 罗 辑 门 电 路 直接 ,快速 地 形成 本 节拍 用 到 的 全 部 控制 信 
号 ,并 送 到 计算 机 的 各 功能 部 件 。 在 这 些 信号 的 控制 下 ,计算 机 各 功能 部 件 会 完成 预期 的 操 
作 功 能 。 顺 便 指 出 ,在 使 用 现场 可 编程 的 大 规模 集成 电路 实现 控制 器 时 ,原来 由 操作 码 译 码 
器 完成 的 功能 已 经 归并 到 这 片 大 规模 集成 电路 中 去 ,往往 看 不 到 单独 的 操作 码 译 码 器 电路 。 

若 暂 不 考虑 处 理 中 断 的 有 关 问 题 , 则 控制 器 的 基本 组 成 和 运行 原理 的 内 容 已 经 介绍 完 
了 ,车 就 止步 于 此 .学 生 学 到 的 只 限于 一 些 抽象 知识 ,更 深入 的 实用 内 容 尚 未 见 到 ,也 难以 了 
解 学 过 的 知识 可 以 用 到 哪里 ,怎么 去 用 ,就 如 同 远 远 地 看 到 一 座 山 ,看 到 的 只 限于 山 的 轮廓 
和 大 体形 状 , 而 不 是 更 精妙 多 彩 的 美景 ,自然 也 就 感觉 不 到 游玩 的 乐趣 ,要 找到 乐趣 ,需要 走 
近 大 山 , 亲 自 息 一 候 , 仔 细 观 赏 , 细 细 品味 , 山 的 每 一 处 美景 都 会 紧 紧 抓 住 你 的 眼球 ,刺激 到 
你 的 每 一 根 神经 ,让 你 陶醉 与 感叹 ,不 虚 此 行 ! 学 习 计 算 机 组 成 原理 课程 也 是 这 个 道理 , 基 
础 知识 、 基 本 技术 应 该 了 解 ,如 同 远 处 看 山 . 还 需要 知道 这 些 知识 可 以 用 到 哪里 ,选用 什么 技 
术 将 它 实现 出 来 ,实现 出 来 的 计算 机 系统 有 什么 功能 ,怎样 去 使 用 它 等 ,这 才 是 更 加 精彩 的 
部 分 ,乐趣 所 在 ,但 需要 花费 较 多 的 时 间 和 精力 ,相当 于 疏 山 观 景 。 为 此 下 面 给 出 2 个 典型 
计算 机 系统 及 其 控制 器 部 件 的 实例 。 


6.2.2 MIPS32 计算 机 的 控制 器 简介 


1. MIPS32 计算 机 的 指令 系统 
MIPS32 是 32 位 字 长 .典型 RISC 结构 的 计算 机 , 即 指令 .ALU 、 主 存储 器 .地 址 总 线 和 
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数据 总 线 等 都 是 32 位 字 长 。 该 系统 只 使 用 3 种 非常 规范 的 指令 格式 ,如 图 6. 3 所 示 。 
MISP 指令 系统 用 到 的 寻 址 方式 和 指令 条 数 少 。 在 有 的 型 号 中 ,还 提供 一 套 16 位 字 长 的 指 
令 系 统 , 以 更 方便 地 支持 嵌入 式 系统 的 使 用 要 求 。 对 主 存储 器 中 的 数据 支持 按 字 、 半 字 、 字 
节 3 种 方式 读 写 。 指 令 在 存储 器 中 按 字 对 齐 方式 存储 ,保证 每 条 指令 都 被 保存 在 一 个 存储 
字 单 元 中 。 地 址 总 线 的 高 30 位 用 于 访问 存储 字 , 最 低 2 位 用 于 区 分 半 字 和 字 节 , 按 字 访问 
存储 器 时 ,地 址 总 线 的 最 低 2 位 的 值 为 00。 



































31 2625 2120 1615 11 10 65 0 
op TS rt | rd | sa func 
(a) R 型 指令 
31 26 25 2120 1615 0 
op TS rt | immediate 
(b) 1 型 指令 
31 2625 0 
target 
(c) J 型 指令 


图 6.3 MIPS 机 的 3 种 指令 格式 


第 1 种 指令 称 为 R 型 指令 .完成 rd<rs op rt 的 运算 功能 (ADD.,SUB,.,AND,OR);rd 一 
(rs 过 rt) 的 操作 功能 (SLT) ,rs 的 内 容 比 rt 的 内 容 小 则 rd 置 "1” ,否则 清 0。 

第 2 种 指令 称 为 1 型 指令 ,完成 rt<-rs op immediate 的 运算 (ADDI, ANDI.ORI) ;rt 一 
memory[ base 十 offset] 的 操作 功能 (LW);memory[ base 十 offset]<rt 的 操作 功能 CSW) ; 若 
rt 一 rs ,转移 到 地 址 PC 十 offset x 4 ,否则 顺序 执行 ;车 rt 一 二 rs, 转 移 到 地 址 PC 十 offset x 4， 
否则 顺序 执行 。 

第 3 种 指令 称 为 J 型 指令 .完成 无 条 件 跳 转 的 操作 功能 。 例 如 J, 即 用 PC 的 最 高 4 位 
的 值 拼接 targetX4 的 值 作为 跳 转 的 指令 地 址 。 

从 对 全 部 指令 都 选用 相同 的 执行 时 间 完 成 ,还 是 为 不 同类 型 的 指令 设 定 不 同 的 执行 时 
间 来 区 别 , 可 以 把 计算 机 划分 为 单 周 期 CPU 系统 、 多 周期 CPU 系统 和 流水 线 CPU 系统 3 
种 实现 方案 。 单 周期 CPU 系统 的 硬件 资源 利用 率 和 指令 执行 速度 都 比较 低 ,不 是 很 实用 ; 
多 周期 CPU 系统 在 硬件 资源 利用 率 和 指令 执行 速度 两 个 方面 都 得 到 明显 改善 ;流水 线 
CPU 系统 的 硬件 资源 利用 率 和 指令 执行 速度 最 高 .成 为 目前 被 广泛 选用 的 方案 。 多 指令 周 
期 方案 是 学 习 与 理解 指令 流水 线 的 必要 准备 ,是 计算 机 组 成 原理 课程 的 重点 教学 内 容 ,因此 
将 以 MIPS 计算 机 的 多 周期 CPU 系统 为 例 . 介 绍 控制 器 的 组 成 和 指令 执行 过 程 ,这 里 给 出 
的 内 容 更 多 地 用 于 拓展 学 生 的 视野 。 

2. 多 周期 CPU 系统 的 设计 和 实现 方案 

在 多 周期 CPU 系统 中 ,指令 需要 几 个 时 钟 周期 就 为 其 分 配 几 个 周期 ,而 不 是 所 有 指 
令 使 用 相同 的 执行 时 间 , 有 利于 提高 指令 的 执行 速度 和 计算 机 硬件 部 件 的 利用 效率 。 例 
如 ,功能 最 简单 的 指令 只 用 2 个 步骤 完成 ,另外 几 条 指令 用 3 个 步骤 ,算术 和 侵 辑 运算 指 
令 和 写 内 存储 器 指令 用 4 个 步骤 . 仅 有 读 内 存储 器 指令 才 用 5 个 步骤 完成 。 图 6. 4 和 
图 6.5 给 出 了 多 周期 CPU 的 MIPS 计算 机 的 逻辑 框图 和 指令 执行 步骤 (周期 ), 对 图 中 内 
容 作 如 下 说 明 。 
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在 给 出 某 条 指令 在 存储 器 中 的 地 址 时 ,只 需要 给 出 地 址 的 高 30 位 的 值 即 可 ,最 低 2 位 
的 值 必定 为 00 ,在 给 出 某 个 数据 在 存储 器 中 的 地 址 时 , 则 要 给 出 地 址 全 部 32 位 的 值 。 
此 ,在 计算 存储 器 单元 ( 字 、 半 字 、 字 节 ) 地 址 时 ,将 如 何 使 用 指令 中 给 出 的 16 位 的 立即 数 
(immediate) ,针对 读 写 数据 和 读 指令 有 2 种 不 同 的 处 理 。 

(1) 在 计算 读 写 数据 使 用 的 地 址 时 ,这 个 16 位 的 数 是 用 补 码 表示 的 , 它 的 最 高 一 位 是 
数 的 符号 位 ,需要 用 这 个 符号 位 的 值 填充 更 高 的 16 位 (这 项 操作 被 称 为 符号 扩展 ), 以 便 形 
成 一 个 完整 的 32 位 的 数据 , 才 可 以 和 另外 一 个 保存 在 寄存 器 中 32 位 的 数据 相 加 ,得 到 的 计 
算 结果 用 于 读 写 存储 器 的 一 个 字 、 半 个 字 或 一 个 字 节 的 地 址 。 

(2) 读 写 指令 时 ,必须 以 字 为 单位 执行 读 操作 ,指令 中 给 出 的 立即 数 也 是 16 位 的 补 码 
数 , 需 要 进行 符号 扩展 并 左 移 两 位 再 和 一 个 32 位 的 指令 地 址 执行 加 运算 ,使 指令 按 字 转 移 
的 范围 扩大 4 售 。 

(3) 对 跳 转 指令 丁 ,指令 中 给 出 26 位 的 伪 直 接地 址 ,与 上 面 介 绍 的 处 理 立 即 数 字段 的 含 
义 类 似 , 需 要 将 其 左 移 2 位 后 拼接 在 PC 的 最 高 4 位 (PCL31..28]) 的 右 侧 形成 一 个 完整 32 
位 的 指令 地 址 。 

此 外 ,在 使 用 立即 数 进行 算术 或 逻辑 运算 的 指令 中 ,要 区 分 是 算术 还 是 多 辑 运 算 , 对 16 
位 的 立即 数 进行 不 同 的 扩展 处 理 。 

(1) 对 带 符号 的 算术 运算 ,指令 中 给 出 的 立即 数 是 16 位 补 码 数 ,要 进行 符号 扩展 。 

(2) 对 逻辑 运算 ,指令 中 给 出 的 立即 数 是 16 个 二 进 制 表示 的 逻辑 值 ,要 用 16 个 0 填充 
最 高 16 位 的 值 , 这 一 操作 被 称 为 0 扩展 。 

在 多 周期 CPU 的 计算 机 系统 中 ,可 以 使 用 一 个 存储 器 既 存 放 指令 又 存放 数据 ,因为 每 
条 指令 的 功能 是 在 几 个 周期 中 完成 的 ,例如 读 取 指 令 只 在 取 指 周期 (Sif) 执行 , 读 取 数 据 要 
到 数据 读 写 周 期 (Smen) 执 行 , 时 间 上 是 错开 的 ,不 会 产生 冲突 。 但 是 需要 注意 ,为 读 取 指 令 
和 读 写 数据 可 能 使 用 不 同 来 源 的 地 址 , 读 取 指 令 时 使 用 的 地 址 来 自 于 程序 计数 器 (PC) , 读 
写 数据 时 使 用 地 址 来 自 于 ALU 的 计算 结果 ( 接 在 ALU 输出 端的 寄存 器 C) 。 为 此 需要 在 
存储 器 的 地 址 输入 端 A 使 用 一 个 2 选 1 的 电路 选择 2 路 地 址 来 源 ; 读 出 来 的 信息 也 要 保存 
到 不 同 的 线路 中 .指令 需要 保存 在 指令 寄存 器 (IR) 中 ,数据 将 保存 在 存储 器 的 数据 寄存 器 
(DR) 中 。 写 人 存储 器 的 数据 总 是 来 自 于 寄存 器 堆 的 输出 Q: ,通过 寄存 器 B 送 到 存储 器 的 
数据 输入 端 (DD。 

在 多 周期 CPU 的 计算 机 系统 中 ,可 以 把 计算 下 条 相 邻 指令 地 址 和 计算 指令 转移 地 址 
这 两 项 运算 功能 都 交 由 ALU 部 件 完成 ,在 取 指 周期 Sif 完成 PC 十 4 运算 ,在 译 码 周期 Sid 
完成 对 已 经 加 过 4 的 PC 值 和 执行 过 符号 扩展 并 左 移 了 2 位 后 的 立即 数 的 求 和 运算 并 保存 
结果 到 结果 寄存 器 C 中 。 为 此 需要 对 参加 ALU 运算 的 两 路 数据 进行 选择 ,最 终 使 ALU 的 
A 路 输入 变 成 现在 的 2 选 1( 选 择 寄 存 器 A 或 PC),B 路 输入 变 成 现在 的 4 选 1( 选 择 寄存 器 
B、 立 即 数 经 符号 扩展 或 0 扩展 的 结果 、 常 数 4. 立 即 数 经 符号 扩展 并 左 移 了 2 位 的 结果 )。 
对 算术 逻辑 运算 指令 ,ALU 可 以 完成 A op B、A op immediate 运算 ;在 计算 指令 地 址 时 ,PC 
可 以 接收 3 个 来 源 的 结果 ,用 一 个 3 选 1 的 选择 器 电路 完成 选择 。 

(1) 对 指令 顺序 执行 ,PC 接收 PC 十 4 的 运算 结果 (ALU 的 直接 输出 ) ,在 取 指 周期 Sif 
完成 ; 

(2) 对 丁 指令 ,PC 接收 PC( 经 过 加 4 运算) 的 最 高 4 位 的 值 拼接 指令 中 的 target 左 移 2 
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位 后 的 值 ,在 指令 译 码 周期 Sid 完成 。 

(3) 对 BEQ 和 BNE 指令 , 若 转移 条 件 成 立 则 转移 ,PC 接收 保存 在 寄存 器 C 中 的 转移 地 
址 ,在 执行 周期 Sexe 完成 , 若 条 件 不 成 立 ,PC 不 接收 转移 地 址 ,使 用 PC 十 4 的 值 顺序 执行 。 

在 多 周期 CPU 的 系统 中 ,从 寄存 器 组 读 出 来 的 两 路 数据 都 要 缓冲 在 两 个 专用 的 寄存 
器 A 和 B 中 , 写 入 的 数据 同样 来 自 两 处 来 源 ,ALU 的 结果 寄存 器 C 和 存储 器 的 数据 寄存 器 
DR, 需 要 使 用 2 选 1 的 选择 器 电路 。 

在 多 周期 CPU 的 计算 机 系统 中 ,不 同类 型 的 指令 使 用 不 同 个 数 的 时 钟 周期 ,每 条 指令 
的 每 个 执行 步骤 被 安排 在 不 同 的 时 钟 周期 中 完成 ,需要 控制 部 件 依据 正在 执行 的 指令 和 指 
令 当前 所 处 的 执行 步骤 向 计算 机 各 部 件 提供 所 要 求 的 控制 信号 。 例 如 ,至 少 可 以 为 指令 的 
5 个 执行 步骤 分 配 5 个 周期 状态 ,如 图 6.5 所 示 。 








图 6.5 多 周期 CPU 中 的 周期 状态 转移 图 


在 状态 图 中 ,每 一 个 圆 形 图 代表 一 个 状态 周期 ; 圆 内 的 文字 表示 周期 的 名 称 ,它们 分 别 
是 取 指 周期 , 译 码 周 期 .执行 周期 .存储 器 读 写 周 期 .数据 写 回 周 期 ; 圆 外 侧 的 数字 表示 状态 
编码 ;在 周期 之 间 的 矢量 线 表示 状态 转移 的 方向 ;矢量 线 旁 边 的 文字 表示 状态 转移 的 控制 条 
件 ,通常 是 指令 类 别 。 

从 状态 图 可 以 看 到 ,J 类 型 的 指令 只 经 过 Sif 和 Sid 两 个 周期 就 完成 执行 过 程 ;而 转移 
指令 要 经 过 Sif、Sid 和 Sexe 这 3 个 周期 才 完成 执行 过 程 ;SW 还 要 经 过 Smem 周期 .算术 逮 
辑 运算 指令 经 过 Swb 周期 ,它们 各 自用 4 个 周期 完成 执行 过 程 , 仅 有 LW 指令 需要 经 过 全 
部 5 个 周期 结束 执行 过 程 。 

下 面 按照 指令 类 别 和 它们 不 同 的 执行 步骤 ,用 表格 和 文字 说 明 的 方式 ,给 出 不 同 指令 在 
各 周期 需要 完成 的 功能 ,以 及 周期 之 间 的 衔接 关系 ,如 表 6. 1 所 示 。 


表 6.1 各 类 指令 在 不 同 周期 需要 完成 的 功能 

















周期 指令 类 取 指 令 (IF) 译 码 (ID) 执行 (EXE) 访 存 (MEM) 写 回 (WB) 

PC< PC[L31..28] 
全 
IR<— | (target 一 一 2) 
«| Mem[PC] 若 条 件 为 真 ， 

BRANCH 类 C-<- PC 十 网 

(符号 扩展 
_R 类 | (imm<<2) |CAOPB Reg[rdj<C 
SW 指令 PC< PC+4 | A<-Reg[rs] 人 下 Mem[C]<—B 
LW 指令 BRegLrt] 符号 扩展 (imm) | DR<-Mem[rt] | Reg[rt]<DR 
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(1) 在 取 指 周期 (Sif) 完 成 读 取 指令 的 功能 , 即 用 PC 作 地 址 完成 从 存储 器 中 读 出 指令 
并 将 其 保存 到 指令 寄存 器 IR 中 .同时 完成 PC 加 4 的 操作 ,得 到 的 是 下 一 条 相 邻 指令 的 地 
址 。 这 项 功能 公用 于 所 有 指令 ,对 所 有 指令 使 用 完全 相同 的 控制 信号 ,结束 后 无 条 件 进 到 
Sid 周期 。 

(2) 在 译 码 周期 (Sid) 完成 指令 译 码 的 功能 ,所 有 指令 都 要 在 本 周期 完成 相应 的 操 
作 。 完 成 后 将 依据 不 同 指令 进入 不 同 的 后 续 周 期 。 请 注意 ,此 周期 对 本 型 和 非 丁 型 指令 
执行 的 功能 是 不 同 的 ,对 丁 指 令 , 把 通过 PC[31.. 28] 拼 接 (target 二 二 2) 得 到 的 跳 转 地 址 
存 人 PC, 就 结束 本 指令 的 执行 过 程 ,返回 取 指 周期 ,进入 下 一 条 指令 的 执行 过 程 。 对 非 J 
型 指令 , 则 执行 从 寄存 器 组 读 出 2 路 数据 并 分 别 保存 到 寄存 器 A 和 B, 为 指令 下 一 步 运 算 
准备 源 数据 ,同时 执行 PC 内 容 与 经 过 符号 扩展 并 左 移 2 位 的 Immediate 的 相 加 操作 , 求 
得 跳 转 指令 的 地 址 并 保存 到 结果 寄存 器 C 中 ,之 后 进入 执行 周期 (Sexe) ,开始 非 ] 类 指令 
的 下 一 步 操作 。 

(3) 在 执行 周期 (Sexe) ,不 同 指令 将 执行 不 同 的 计算 处 理 功能 ,结束 后 将 转移 到 不 同 的 
周期 ,有 3 种 情形 。 对 BEQ 和 BNE 指令 ,如 果 转 移 条 件 成 立 则 应 该 执行 转移 ,需要 把 前 一 
周期 保存 在 结果 寄存 器 C 中 的 转移 地 址 存 人 PC, 否则 保持 PC 原 有 内 容 不 变 , 之 后 结束 本 
指令 的 执行 过 程 ,返回 取 指 周期 ,进入 下 一 条 指令 的 执行 过 程 。 对 算术 逻辑 运算 指令 ,ALU 
要 完成 相应 的 计算 并 保存 结果 到 寄存 器 C, 之 后 转移 到 结果 写 回 周期 (Swb)。 对 内 存储 器 
读 写 指令 (LW/SW) ,ALU 要 完成 加 法 运算 求 出 要 用 到 的 内 存 地 址 并 保存 结果 到 寄存 器 C， 
之 后 进入 内 存储 器 读 写 周 期 (Smem) 。 

(4) 内 存储 器 读 写 周 期 (Smem) 执 行内 存 读 写 操作 ,内 存 地 址 在 前 一 个 周期 已 经 保存 在 
结果 寄存 器 C 中 。 对 写 存 储 器 指令 .通过 发 写 内 存 命令 ,把 从 寄存 器 堆 读 出 来 .已 保存 在 寄 
存 器 B 中 的 数据 写 人 存储 器 ,完成 后 结束 本 指令 的 执行 过 程 ,返回 取 指 周期 ,进入 下 一 条 指 
令 的 执行 过 程 ;对 读 存 储 器 指令 ,通过 发 读 内 存 命令 ,启动 读 存 储 器 操作 并 把 读 出 内 容 保 存 
到 数据 寄存 器 DR 中 ,然后 进入 结果 写 回 周期 (Swb)。 

(5) 在 结果 写 回 周期 (Swb) ,通过 发 写 寄 存 器 命令 ,把 ALU 的 计算 结果 (已 经 保存 在 寄 
存 器 C 中 ) 或 从 存储 器 中 读 出 的 数据 (已 经 保存 在 数据 寄存 器 DR 中 ) 写 回 到 寄存 器 组 ,之 后 
结束 这 类 指令 的 执行 过 程 ,返回 取 指 周期 ,进入 下 一 条 指令 的 执行 过 程 。 

在 多 周期 CPU 中 ,控制 部 件 把 指令 寄存 器 的 操作 码 字 段 (op) 、 功 能 码 字 段 (func) 的 内 
容 和 ALU 提供 的 判 0 结果 Z 信号 用 作 输 入 信息 ,产生 并 送出 12 组 (合计 18 位 ) 的 控制 信 
号 ,可 以 划分 成 4 类 汇总 如 下 。 

(1) 用 于 PC 和 IR 的 控制 信号 。PCsrc[1..0] 选 择 写 人 PC 的 3 个 指令 地 址 ,00 选择 指 
令 顺 序 执行 地 ;01 选择 指令 分 支 执行 地 址 ;10 选择 指令 跳 转 执行 地 址 。 

WritePC 是 PC 的 写 和 命令 ;WriteIR 是 IR 的 写 入 命令 。 

(2) 用 于 寄存 器 组 的 控制 信和 号。MEMtoREG 选择 写 入 寄存 器 组 的 数据 来 源 (0: 寄存 
器 C;1: 寄存 器 DR);REGdes 选择 写 入 的 寄存 器 编号 (0: rt;1: rd) ;WriteREG 是 寄存 器 组 
的 写 人 命令 。 

(3) 用 于 ALU 的 控制 信号 。EXTmod 选择 Immediate 扩展 方式 .0 代表 零 扩 展 ;1 代表 
符号 扩展 。ALUsrcA 选择 送 到 ALU 的 A 端的 数据 来 源 (0: PC 十 4 的 结果 ,1: 寄存 器 A); 
ALUsrcB[1. .0] 选 择 送 到 ALU 的 B 端的 数据 来 源 ,00 代表 寄存 器 B;01 代表 常数 4;10 代 
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表 扩展 的 imm 的 值 ;11 代表 扩展 并 左 移 2 位 的 imm 的 值 。ALU_func[4..0] 用 于 选择 
ALU 部 件 的 运算 功能 ,X0001 代表 加 运算 ;1001 代表 减 运 算 ; X1010 代表 比较 运算 ;00000 
代表 与 运算 ;01000 代表 或 运算 。 

(4) 用 于 存储 器 的 控制 信号 。Madr_sel 用 于 选择 存储 器 地 址 的 来 源 ,0 选择 PC;1 选择 
寄存 器 C。WriteMEM 是 存储 器 的 写 和 人 命令 。 


6.2.3 TEC XP_ 开 教 学 计算 机 的 硬 布线 控制 器 的 设计 与 实现 


这 人 台 教 学 计算 机 是 本 书 作者 专门 针对 计算 机 硬件 教学 ,特别 是 计算 机 组 成 原理 课程 的 
教学 与 实验 而 设计 实现 的 。 其 特点 是 组 成 简单 完整 ,体现 原理 清楚 ,紧密 配合 教材 ,易于 动 
手 操 作 , 配 备 小 巧 软件 系统 ,汇集 了 此 前 二 十 多 年 间 研 发 的 多 种 机 型 的 特点 和 长 处 ,又 在 设 
计 目 标 、 设 计 和 实现 的 手段 等 方面 作 了 重大 改动 ,着 力 增强 实验 操作 的 方便 程度 。 下 面 分 层 
次 地 讲解 这 个 控制 器 部 件 的 有 关内 容 。 

1. 教学 计算 机 的 部 件 组 成 及 其 连接 关系 

控制 器 部 件 用 于 控制 整 机 系统 中 的 各 个 部 件 协同 运行 。 讲 解 控制 器 之 前 ,一 定 要 对 整 
机 系统 有 个 初步 了 解 , 这 里 首先 把 实现 这 台 计 算 机 的 指令 系统 、 各 部 件 的 功能 与 组 成 ,以 及 
上 述 内 容 都 出 现在 教材 的 哪 一 章节 说 明 清楚 。 从 不 同 的 教学 进度 安排 考虑 ,有 些 章节 可 能 
已 经 讲 过 ,这 里 只 是 把 那 一 章 中 的 部 件 实例 拿 过 来 构建 整 机 系统 ,而 男 外 一 些 章 节 可 能 尚未 
讲 到 ,详细 内 容 学 生还 不 是 太 懂 ,需要 教师 把 构建 整 机 系统 用 到 的 少量 知识 进行 简单 介绍 ， 
例如 把 内 存储 器 、 总 线 、 接 口 和 输入 输出 设备 的 完整 内 容 安 排 在 控制 器 教学 之 后 再 学 习 就 是 
可 行 的 选择 。 若 把 控制 器 教学 实验 安排 在 全 部 授课 结束 后 的 期 末 进 行 ,在 开展 控制 器 部 件 、 
几 个 执行 部 件 实验 的 时 候 就 会 遇 到 一 些 难 以 调和 的 矛盾 。 

TEC_XP_[ 实 现 的 是 教学 计算 机 的 指令 系统 ,相关 内 容 取 自 本 教材 5. 3. 4 节 的 指令 系 
统 实例 ,在 硬件 系统 保持 与 前 期 产品 相同 功能 的 基础 上 ,又 确保 了 良好 的 软件 兼容 性 。 

这 台 计 算 机 的 运算 器 部 件 取 自 本 教材 4.2. 3 节 的 运算 器 实例 ;控制 器 部 件 是 本 节 讲 解 
的 控制 器 部 件 实例 ;存储 器 部 件 取 自 本 教材 7. 3 节 的 存储 器 部 件 实例 ; 串 行 接口 取 自 本 教材 
11.3.3 节 的 接口 实例 ;总 线 采用 本 教材 11. 2. 2 节 讲 述 的 单 总 线 结 构 ; 输 入 输出 采用 本 教材 
11.4.1 节 讲 述 的 程序 直接 控制 方式 ;输入 输出 设备 是 通过 PC 实现 的 仿真 终端 ,只 要 运行 
PC 系统 中 的 pcec16. com 程序 ,PC 就 成 为 教学 计算 机 的 输入 输出 设备 ,使 教学 计算 机 有 了 
执行 字符 型 数据 的 输入 输出 能 力 。 

现在 的 首要 工作 是 设计 教学 计算 机 整 机 系统 的 组 成 ,之 后 再 来 实现 这 个 控制 器 部 件 。 
整 机 系统 的 设计 结果 如 图 6. 6 所 示 . 还 可 以 进一步 抽象 ,简化 为 图 6. 1 的 表示 方式 。 

实验 计算 机 字 长 16 位 ,寄存 器 、 总 线 、 指 令 和 数据 通常 都 选 定 为 16 位 字 长 ,存储 器 按 字 
寻 址 ,指令 系统 与 PC8086 的 指令 系统 比较 接近 ,但 更 为 简单 精 小 。 

从 图 6.6 中 可 以 看 到 ,教学 计算 机 硬件 系统 包括 了 计算 机 传统 的 5 大 功能 部 件 : 控制 
器 部 件 (在 图 的 左上 部 ) ,运算 器 部 件 (在 图 的 左下 部 ) ,内 存储 器 部 件 (在 图 的 右 下 部 ) ,输入 
设备 (键盘 ) 和 输出 设备 (显示 器 ) ,输入 输出 设备 是 用 PC 实现 的 仿真 终端 (在 图 的 右上 方 )， 
经 电 平 转换 电路 MAX202 芯片 接 人 主机 系统 。 

本 系统 采用 的 是 单 总 线 结构 ,通过 把 全 部 的 功能 部 件 都 直接 连接 到 这 组 总 线 上 来 组 成 
整 机 系统 ,部 件 之 间 需 要 经 过 总 线 完成 信息 传送 。 
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图 6.6 实验 计算 机 的 整 机 系统 的 基本 组 成 框图 


(1) 数据 总 线 DB 直接 连接 到 存储 器 和 串 行 接口 芯片 双向 输入 输出 的 数据 线 引 脚 ,又 
连接 到 运算 器 芯片 的 数据 输入 引 脚 D 和 带 有 三 态 输出 控制 的 数据 输出 引 脚 Y, 还 连接 到 控 
制 器 部 件 的 (MACH 芯片 ) 的 信息 输入 引 脚 和 输出 引 脚 ( 双 向 输入 输出 ,输出 带 有 三 态 控 
制 ) ,以 及 指令 寄存 器 IR 的 输入 引 脚 ,这 样 就 可 以 支持 主机 的 几 个 部 件 之 间 正 常 的 数据 传 
送 功能 。 

(2) 地 址 总 线 AB 直接 连接 到 控制 器 部 件 的 地 址 输出 引 脚 ,其 最 高 3 位 连接 一 片 138 译 
码 器 用 于 产生 存储 器 的 片 选 信号 ,最 低 的 13 位 送 到 存储 器 芯片 的 地 址 线 引 脚 ,用 于 选择 存 
储 器 芯片 内 的 一 个 存储 单元 。IO 端口 地 址 直接 由 指令 寄存 器 IR 的 低 8 位 提供 。 

(3) 控制 总 线 CB 通常 不 会 表示 在 整 机 系统 的 组 成 框图 中 ,我 们 却 在 图 6.6 中 以 非常 醒 
目的 方式 表明 了 控制 器 部 件 对 运算 器 .内 存 和 串口 提供 的 控制 信号 和 少量 数据 信息 ,包括 为 
控制 运算 器 部 件 使 用 了 17 位 的 控制 信号 .还 用 到 4 位 的 数据 和 标志 位 信息 ,传送 这 21 位 信 
号 不 必 使 用 控制 总 线 ; 为 控制 内 存 和 串口 只 用 到 3 位 的 控制 信号 (通过 控制 总 线 传 送 ) ,再 经 
由 3 片 译 码 器 芯片 产生 内 存 、 串 口 的 读 写 命令 和 片 选 信号 (通过 控制 总 线 传送 )。 

在 具体 深入 地 学 习 控制 器 部 件 的 组 成 和 功能 之 前 , 先 概要 了 解 这 些 内 容 是 必要 的 。 

2. 教学 计算 机 的 线路 组 成 

整 机 硬件 系统 的 线路 组 成 如 图 6.7 所 示 。 在 这 张 图 中 ,比较 详细 地 给 出 了 控制 器 部 件 
的 线路 组 成 ,学 懂 控 制 器 的 功能 与 组 成 是 计算 机 组 成 原理 课程 的 重点 教学 内 容 。 

硬 布线 控制 器 部 件 由 1 片 ispMACH 芯片 和 2 片 74LS377 芯片 组 成 ,运算 器 部 件 由 4 
片 4 位 的 Am2901 运算 器 芯片 组 成 ,这 2 个 部 件 合 在 一 起 构成 CPU 系统 。 

内 存储 器 部 件 由 2 片 8 位 的 ROM 芯片 (用 于 保存 监控 程序 ) 和 2 片 8 位 的 RAM 芯片 
组 成 (用 于 保存 数据 和 用 户 程序 ) 。 
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2 路 串 行 接口 选用 的 是 Intel-8251 芯片 (在 内 存储 器 部 件 上 方 ) ,用 于 连接 PC 实现 的 仿 
真 终端 ,支持 字符 型 数据 的 输入 和 输出 操作 ,以 便 支持 和 运行 监控 程序 。 

在 这 个 硬件 系统 中 ,运算 器 、 存 储 器 、 串 行 接口 电路 选用 的 都 是 功能 固定 的 芯片 ,核心 知 
识 是 这 些 芯 片 的 内 部 线路 组 成 和 运行 原理 ,涉及 的 技术 是 用 不 同 芯片 构建 计算 机 的 部 件 ; 只 
有 isp MACH 芯片 是 现场 可 编程 的 ,主要 用 于 实现 控制 部 件 的 PC、CU、Timing 等 相关 的 功 
能 ,而 把 控制 部 件 中 的 IR 设置 在 这 个 芯片 之 外 ,选用 2 片 74LS377 芯片 来 实现 。 我 们 还 把 
内 存 地 址 寄存 器 AR 标志 位 寄存 器 flag .与 中 断 有 关 的 电路 (图 中 未 画 出 ) 也 一 并 纳入 到 这 
个 芯片 中 实现 。 

在 这 个 芯片 内 ,还 实现 了 一 个 16 位 加 法 器 ,专用 于 计算 指令 地 址 (PC 十 1 或 PC 十 
offset) 。 

仿真 终端 是 通过 执行 PC 系统 中 的 pcec16. com 程序 启动 运行 的 ,同学 应 该 更 多 地 关注 
它 实现 的 功能 和 操作 方法 。 

从 图 6.7 中 还 可 以 看 到 ,系统 中 还 使 用 了 3 片 译 码 器 芯片 ,1 片 双 二 -四 译 码 器 74LS139 
通过 对 CPU 提供 出 来 的 mio、req、we 这 3 位 信号 的 译 码 ,产生 存储 器 与 串 行 口 的 读 写 命令 
(mwe,iord ,iowr) ,2 片 三 - 八 译 码 器 74LS138 分 别 用 于 对 地 址 总 线 的 最 高 3 位 、 指 令 寄 存 器 
的 IRi~IR, 进行 译 码 ,产生 内 存 和 串口 芯片 的 片 选 信和 号 (meso、mcsi、mcess、*…、iocso、 
iocsl ) 。 

还 有 1 片 MAX202 芯片 ,用 于 实现 教学 计算 机 串 行 口 的 输入 输出 信号 的 电 平 转换 , 确 
保 使 其 能 够 与 仿真 终端 那 一 方 的 串 行 口 进行 正常 连接 和 通信 。 

3. 控制 部 件 的 组 成 .设计 与 实现 

此 前 已 多 次 说 到 ,在 教学 计算 机 中 , 硬 布线 方案 的 控制 器 部 件 需 要 由 程序 计数 器 PC、 指 
令 寄存 器 IR 节拍 发 生 器 Timing ,控制 信号 产生 电路 CU 这 4 个子 部 件 组 成 。 它 的 IR 选用 
2 片 8 位 的 寄存 器 74LS377 芯片 构成 ,其 余 3 个 子 部 件 都 在 可 编程 的 ispMACH 芯片 内 部 
实现 。 

4. 设计 指令 系统 

为 教学 计算 机 设计 的 指令 系统 已 在 教材 的 第 5 章 讲解 过 ,并 使 用 汇编 语言 开展 了 必要 
的 程序 设计 实验 。 现 在 只 把 它 的 指令 格式 复制 在 这 里 ,如 图 6.8 所 示 。 具 体 的 指令 请 查阅 
教材 的 5.3.4 节 内 容 。 





DR SR 
操作 码 





IO 端口 地 址 / 相对 偏 移 量 








立即 数 / 直接 内 存 地 址 / 变 址 偏 移 量 











图 6.8 教学 计算 机 的 指令 格式 


5. 划分 指令 的 执行 步骤 

划分 节拍 的 依据 : 若 硬件 上 能 实现 ,以 用 更 少 的 步骤 完成 指令 的 运行 过 程 为 好 ,为 此 可 
为 不 同 指令 选用 不 同 的 步骤 数 ,这 被 称 为 多 种 指令 周期 方式 ; 读 取 指令 用 一 个 步 又 ;完成 数 
据 运算 用 一 个 步骤 , 读 或 写 一 次 数据 存储 器 用 两 个 步骤 〈 分 别 完成 送 地 址 到 地 址 寄存 器 
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AR ,执行 存储 器 的 数据 读 写 操作 ) 。 

可 以 看 到 这 种 划分 结果 中 没有 用 到 分 析 指 令 的 步骤 ,这 是 因为 这 人 台 教 学 计算 机 的 组 成 
很 简单 ,强调 突出 CPU 的 基本 组 成 和 指令 的 顺序 执行 过 程 ,没有 使 用 提高 指令 执行 速度 的 
更 复杂 的 技术 。 

对 于 单字 指令 , 读 取 指 令 可 以 在 一 个 步 又 中 完成 ,这 是 因为 PC 的 内 容 ( 指 令 地 址 ) 可 以 
直接 送 到 (不 必 经 过 内 存 地 址 寄存 器 AR) 地 址 总 线 AB; 对 于 双 字 指令 , 读 取 指令 的 两 个 指 
令 字 各 用 一 个 步骤 完成 。 而 读 写 数据 则 要 用 两 个 步 又。 

运算 器 完成 一 次 数据 运算 可 以 用 一 个 步骤 完成 ,因为 在 使 用 的 运算 器 芯片 中 ,把 读 寄存 
器 组 中 的 数据 .ALU 运算 .结果 写 回 寄存 器 这 3 项 操作 安排 在 同一 个 时 钟 周期 完成 。 还 需 
要 注意 ,本 硬件 系统 中 没有 设置 存储 器 的 数据 寄存 器 ,从 主 存 .串口 中 读 出 的 数据 信息 可 以 
直接 经 过 数据 总 线 DB 写 和 到 运算 器 的 某 个 寄存 器 中 ,这 与 MIPS32 系统 有 明显 不 同 。 

本 控制 器 选用 多 指令 周期 方式 实现 , 若 暂 不 考虑 中 断 响应 和 处 理 功能 ,全 部 30 条 基本 
指令 都 可 以 在 2 一 4 个 周期 完成 ,其 中 的 21 条 A 组 指令 用 2 个 周期 完成 ,8 条 B 组 指令 用 3 
个 周期 完成 , 仅 有 1 条 CALA 指令 用 4 个 周期 完成 (包括 读 取 双 字 指 令 的 2 个 指令 字 用 2 
个 步骤 ,保存 程序 断 点 到 堆栈 用 2 个 步 又 ,是 一 次 写 数据 存储 器 的 操作 )。 节 拍 的 划分 结果 
如 图 6.9 所 示 。 
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000 Cif 010 Cexe a 011 Cmeml a 001 Cmem2 


图 6.9 30 条 基本 指令 的 4 个 执行 步骤 及 其 衔接 关系 
































(1) 取 指 周期 是 每 条 指令 的 第 一 个 执行 步骤 ,完成 从 存储 器 中 读 取 指令 并 存 和 人 了 下 
(MEM-~>~IR) 和 形成 下 条 指令 地 址 (PC 十 1-~PC) 的 功能 ,不 受 指 令 控制 。 要 用 到 内 存 和 控 
制 器 。 

(2) 执行 周期 是 全 部 30 条 指令 的 第 二 个 执行 步 又, 不同 指 令 将 完成 不 同 的 操作 功能 。 

Q@ 12 条 算术 和 侵 辑 运算 指令 ,要 在 运算 器 部 件 内 部 完成 相应 的 计算 操作 ,依据 指令 要 
求 保存 计算 结果 ,还 要 保存 标志 位 信息 到 flag 寄存 器 (设置 在 控制 器 芯片 中 ) 。 

@ 5 条 相对 转移 指令 .要 在 控制 器 部 件 内 部 完成 相应 的 转移 地 址 计算 ,依据 指令 要 求 
保存 转移 地 址 到 PC。 

@ 2 条 双 字 指令 中 的 长 转移 指令 ,要 从 存储 器 读 取 指令 转移 地 址 (第 二 个 指令 字 ) 并 送 
PC; 对 传送 立即 数 指令 ,要 从 存储 器 读 取 立即 数 (第 二 个 指令 字 ) 传送 到 运算 器 的 DR 寄存 
器 ,执行 PC 十 1 并 送 PC。 要 用 到 内 存 和 控制 器 / 运算 器 。 

@ 2 条 输入 /输出 指令 ,要 在 运算 器 的 Re 寄存 器 和 串 行 接口 之 间 完 成 8 位 数据 的 传 
送 。 要 用 到 运算 器 和 串口 。 

@ 8 条 需要 读 写 数据 存储 器 ( 含 堆栈 区 ) 的 指令 ,要 计算 存储 器 的 单元 地 址 并 传送 到 存 
储 器 的 地 址 寄存 器 AR。 要 用 到 运算 器 和 控制 器 芯片 中 的 AR。 

@ 1 条 CALA 指令 要 从 存储 器 读 子 程序 人 口 地 址 (第 二 个 指令 自 ) 送 PC, PC 十 1 暂 存 
到 NPC。 
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(3) 存储 周期 1 是 9 条 指令 的 第 三 个 执行 步骤 ,其 中 3 条 指令 完成 写 各 自 数 据 到 存储 
器 ,另外 5 条 指令 完成 从 存储 器 中 读 出 信息 并 写 入 各 自 指定 的 寄存 器 。 要 用 到 内 存 和 运算 
器 控制 器 。CALA 指令 需 完成 修改 堆栈 指针 并 传送 结果 到 AR 寄存 器 。 要 用 到 运算 器 、 控 
制 器 中 的 AR。 

(4) 存储 周期 2 是 CALA 指令 的 第 四 个 执行 步骤 ,完成 写 NPC 内 容 ( 主 程序 断 点 ) 到 
堆栈 。 要 用 到 内 存 和 控制 器 中 的 NPC。 

6. ABEL 程序 实例 

控制 器 的 主要 功能 都 在 可 编程 的 MACH 芯片 内 部 实现 ,需要 通过 ABEL-HDL 硬件 描 
述 语言 来 描述 其 电路 组 成 和 功能 ,为 此 会 涉及 这 个 语言 的 语法 规则 ,程序 结构 等 内 容 , 以 及 
对 ABEL 程序 的 编译 ,优化 ,对 结果 的 下 载 等 操作 方法 。 我 们 会 以 适当 手段 提供 必要 文档 
说 明 , 但 不 准备 在 这 里 对 这 些 内 容 进行 详细 讲解 ,还 是 直接 给 出 一 个 最 简单 的 实现 4 条 指令 
的 ABEL 程序 实例 更 好 。 

下 面 给 出 的 是 实现 4 条 基本 指令 (ADD、AND、MVRD、JMPA) 的 硬 布线 控制 器 的 
ABEL 语言 源 程 序 , 程 序 有 60 多 行 并 加 了 详细 注释 。 学 生 需 要 认真 学 习 研 究 这 个 程序 的 内 
容 ,之 后 才 会 有 能 力 在 这 个 程序 中 增加 属于 算术 逻辑 运算 及 相对 转移 的 3 条 指令 (SUB、 
SHR JRNC) .内存 读 写 的 2 条 指令 (LDRR .STRR) ,执行 输入 输出 的 2 条 指令 (IN、OUT)， 
作为 学 习 控 制 器 、 使 用 存储 器 ,使 用 接口 的 实验 内 容 。 使 用 这 11 条 指令 写 出 的 小 程序 ,可 以 
控制 整 机 系统 各 部 件 协同 运行 。 

MDDUTE TEC_ new" 

TITIE ‘omntroller omponent'" 


"2014/10/18 

TECIARATIONS 

RESET, CIK pin 151,68; 

CY,zeroyran0 pin 169,171,139; 

IR15..IR0 pin 64..57,54..47; 

BRB15..aB0 pin 87..80,77..70; 

LB15..[E0 pin 24,23, 26, 25, 28, 27, 30, 29, 32. .39; 
MIO, REQ, WE pin 95, 94, 93 istype ‘om'; 

I8..10 pin 14..21, 135 istype 'dc,om'; 


B3..B0,A3..A0 pin 9..12, 5..8 istype 'om'; 
aluoe,c0,raml5 pin 136,141,137 istype 'dc,om'; 


可 .0 pin 162, 160, 158; 

EC, FZ pin 168, 170; 

RGIRck pin17,15; 

了 cl15.-Pc0 mode istype 'reg, kesp'; 
ar15. .ar0 node istype "regrjkeep'7 
t 2..t 0,flag c,flag z node istype 'reg,kesp'; 
Pc ce ar oe noge istype 'om'; 
flag c os,flag z ce node istype "com'7 
A,B_ node istype 'dc,oam'; 
Suml5. .sund, jr zu node istype "com'7 


wk15. .wk0, cy15. .cyl mode istype ‘oam'; 


人 

Po= [pcl15.-pc0]; 

RE- [AB15. .ABO]; 

timing= [t 2.- 0]; 

cexe = (timing== [0,1,0]); 

ir_ op= [IR15. .1R8]; 

RDD= (ir op== [0,0,0,0,0,0,0,0]); 
MRD= (ir op== [1,0,0,0,1,0,0,0]); 
SUB = (ir cp== [0,0,0,0,0,0,0,1]); 
JUENC= (ir oqp== [0,1,0,0,0,1,0,1]); 
IDRR= (ir op== [1,0,0,0,0,0,0,1]); 
IN = (ir op== [1,0,0,0,0,0,1,0]); 


ERURTICNS 


Tt 2; ma= 七 17 TO=t 0; 


FCflag c;F tflag 2z; 


[timing,pc,ar, flag c,flag 2].cl= Ck; 
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ar= [arl5..ar0]; 
IB= [DB15..rB0]; same [suml5..sum]; 
cif (timing== [0,0,0]); 

meml= (timing== [0,1,1]); 


地 9 四 


AD= (ir op== [0,0,0,0,0,0,1,0]); 
MER (ir op== [1,0,0,0,0,0,0,0]); 
SHR= (ir op== [0,0,0,0,1,0,1,1]); 


SIFF= (ir_ op== [1,0,0,0,0,0,1,1]); 
T= (ir op== [1,0,0,0,0,1,1,0]); 


PC_ce= FESET# !FESETE (cif# cexeg MVRDE JMEA# JRNCE!flag c))7 


when FESET then {po=0; timing:=0;} else 


{ when cif then timing= [0,1,0]; 


when Osxeg (STRR# ILRR) then timing= [0,1,1]; 


when pc_oe then 


Fc = sum& (cif# cexe& (RD# JFNCE !flag c)) 


# LB& cexe5JMER; 
RG!cif; IRclkeCk; 


flag c_ce = cexeg (ADD# SUEB# SHR# AND); flag c.ce= flag c oe; 
when flag c¢ oe then flag c= osxeg ( (ADD# SUB) gCy# SHREramD# ANDEO); 
flag z ce = cexeg (ALD# SUB# AND); flag z.ce= flag c_ oe; 
when flag 2 ce then flag 2 cenes (ADD# SUB# AND) g7ero; 


ar Oc Oexe& (SIFR# IDFR) ar.os=ar oe; 


when ar_ce then ar= [B; 


when ameml& (STRR# LIRR) then AB= ar; else BB=pc; 


when ([A_,B_]== [0,0]) then {[B3..B0]= [IR7..IR4]; [A3..20]= [IFR3..1IRO];} 
when (A_,B ]== [0,1]) then {[B3..B0]= [0,1,0,0]; [A3..20]= [0,1, 0,0];} 
when ([A_,B ]== [1,0]) then {[B3..B0]= [0,0,0,0]; [23..A0]= [0,0, 0,0];} 


raml5s=0; raml5.0e= !IR7; 


@ incluge 'adder pcl.abl' 
TFUIH TPEIE 


([t 2..+ 0,1RI5..1F8]- > falue,d0,18..16,15..73,72..10,A ,B_,MIO,FED,WE]) "Hag 
[0,0,0, 3 5 > [Ll,0, 0,0,1, 0,0,0, 000 0,0, 001; " 歌 指 MMec)>IRFC+I>EC 
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[0,1,0, 0,0,0,0,0,0,0,0]} -> [0,0, 0,1,1, 000 001 0,0, 1,0,0]; HD IRrR>IR oz 
[0,1,0, 00000010-> [0,0, O11, 100 0,0,1, 0,0, 1,0,0]; "HD IRSSR>IR 0z 
[0,1,0, 10000000-> [1,0, 0,0,1, 0,0,0, 000 0,0, 0,0,1]; "MA MM >EC 
[0,1,0, 1,0,0,0,1,0,0,0]-> [1,0, 011 000 ,l,l, 0,0, 0,0,1]; "MWFDMMEC >IREC+tI>EC 
“ [0,1,0, 0,0,0,0,0,0,0,1]-> [Ol Ol, 001 001 00 100 SB 了 及 -SR>BR cz 
“ [10 0,0,0,0,1,0,1,1]-> [0,0, 1,0,1, 000 100 00 1,0,0]; SR 下 /2 一 下 o/ 
“ [0,1,0, 0,1,0,0,0,1,0,1]—> [1,0, 0,0,1, 0,0,0, 0,0,0, 00 1,0,0]; JRNC ?EC+ offset >FC 
“ [0,1,0, 10000010-> [0, Ol, 000 Ll 10 OL; NWN EEN>MD 

“ [0,1,0, 1,0,0,0,0,1,1,0]—> [0,0, 001 000 100 10 0,1,0]; Or FO> (EED) 

“ [0,1,0, 1,0,0,0,0,0,0,1]—> [0,0, 001 000 100 00 1,0,0]; IIER SR 下 

“ [0,1,0, 1,0,0,0,0,0,1,1]—> [00 001 000 011 00 1,0,0]; STR PR 下 

“01 1,0,0,0,0,0,0,1]-> [l,0, 011 000 111 00 0,0,1]; IERMM=ER 

“0 10000013-> [0,0, 0,0,1, 000 1,0,0, 00 0,0,0]; SIFR SR>MM 

ED 


这 个 程序 由 4 个 基本 段 组 成 ,包括 头 段 .结束 段 .说 明 段 .逻辑 描述 段 ,符合 ABEL 语言 
的 规定 。 

1) 头 段 

头 段 由 程序 开始 的 前 3 行 组 成 ,用 标识 符 给 出 工程 项 目 模块 名 ,用 字符 串 给 出 标题 名 ， 
用 注释 指出 程序 的 文件 名 。 

2) 结束 段 

结束 段 是 程序 的 最 后 一 个 语句 END ,表明 程序 至 此 全 部 结束 。 

3) 说 明 段 

说 明 段 是 在 DECLARATIONS 之 后 给 出 的 语句 ,用 于 描述 以 下 3 部 分 内 容 。 

(1) MACH 芯片 的 输入 输出 信号 名 称 及 其 对 应 的 器 件 引 脚 号 ,并 以 注释 方式 指出 各 自 
在 逻辑 电路 中 的 用 法 或 功能 。 

(2) 给 出 了 MACH 芯片 的 内 部 节点 信号 名 称 和 类 型 ,也 以 注释 方式 指出 各 自在 逻辑 电 
路 中 的 用 法 或 功能 。 

(3) 给 出 了 程序 中 选用 的 专用 常量 和 集合 ,表示 节拍 编码 和 指令 的 标识 符 等 ,这 对 于 简 
化 ABEL 程序 编写 .提升 程序 的 可 读 性 非常 有 效 。 

4) 逻辑 描述 段 

逻辑 描述 段 是 在 EQUATIONS 之 后 给 出 的 语句 ,描述 了 芯片 内 部 基本 电路 的 逻辑 功能 
及 其 实现 。 程 序 中 还 以 @include adder_pcl. abl 的 方式 把 一 段 ABEL 程序 引入 到 本 程序 
中 , 它 实现 的 功能 是 pc 十 1 或 者 pc 十 offset( 带 进位 扩展 ) 一 pc, 专 用 于 计算 指令 地 址 ,用 到 
的 只 是 线路 设计 知识 ,没有 必要 把 这 段 程序 直接 写 在 本 程序 中 。 

逻辑 描述 段 的 核心 部 分 包括 两 部 分 电路 。 

(1) 在 MACH 芯片 内 部 的 时 序 逻 辑 电路 ,包括 程序 计数 器 PC、 内 存 地 址 寄存 器 AR、 节 
拍 发 生 器 Timing 标志 位 触发 器 flag_c 和 flag_z, 都 是 选用 逻辑 方程 语句 进行 描述 的 ,就 是 
根据 这 些 电 路 需要 在 哪 一 条 指令 (依据 指令 操作 码 ) 的 哪 一 个 执行 步骤 (依据 节拍 发 生 器 编 
码 ) 接 收 从 哪里 传送 给 它 的 信息 或 者 需要 送出 信息 到 何 处 (哪个 电路 ) 去 ,来 写 出 相应 的 逻辑 
方程 式 , 这 最 为 简捷 和 直观 ,从 加 了 详细 注释 的 ABEL 程序 中 可 以 看 得 很 清楚 。 
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例如 ,程序 中 的 when RESET then {pc 二 0; timing: 二 0;) else (…) 语句 表明 了 在 系统 
复位 时 ,timing 要 被 清 零 ,之 后 每 来 一 个 时 钟 脉冲 都 应 切换 为 一 个 新 的 节拍 状态 ,状态 转换 
关系 是 : 000 状态 时 将 无 条 件 转换 为 010 状态 ,在 010 状态 时 , 若 执行 的 是 内 存 读 写 指令 就 
转换 为 011 状态 ,否则 转 回 000 状态 。 在 这 种 运行 情况 下 ,需要 通过 用 语句 timing. CLK= 
CLK 来 为 其 指定 时 钟 信 号 。 

类 似 的 是 ,程序 计数 器 pc 也 需要 在 系统 复位 时 被 清 零 ,但 此 后 它 只 在 某 些 条 件 下 才 接 
收 新 值 ,否则 应 保持 不 变 , 为 此 需要 指定 pc 为 带 有 接收 使 能 控制 的 寄存 器 ,这 可 以 通过 语句 
pce. ce 二 pc_ce 完成 ,并 且 需 要 具体 指出 接收 条 件 和 pc 接收 的 信息 之 间 的 对 应 关系 ,如 : 


when Pc_ce then 
Po= sumg (cif# cexe& MVRDE JFNCE !flag c)) 
# LB& cexeSOMER7 


pc_ce 是 pc 的 接收 使 能 控制 , 仅 在 该 值 为 真 时 ,pc 才 接 收 输入 ;否则 pc 内 容 保 持 不 变 。 
pc 接收 的 内 容 有 两 个 来 源 : 专用 加 法 器 的 输出 sum, 或 者 是 从 内 存 读 出 来 的 指令 地 址 (通过 
数据 总 线 DB 传送 到 pc) 。 此 处 向 pc 赋值 的 赋值 符 使 用 的 是 “一 ”, 而 不 再 是 " :一 ”。 为 准确 
理解 这 条 语句 需要 查阅 有 关 ABEL 语言 的 有 关内 容 。 

在 本 系统 中 ,地 址 寄存 器 AR 只 用 于 接收 并 保存 内 存 地 址 信息 ,并 且 需 要 在 执行 内 存 读 
写 的 前 一 个 步骤 完成 ,到 了 下 一 步 再 把 AR 的 内 容 送 到 地 址 总 线 AB, 提供 执 行内 存 读 写 用 
到 的 地 址 信息 。 

请 注意 ,到 内 存 读 取 指 令 是 不 使 用 内 存 地 址 寄存 器 的 ,而 是 把 保存 指令 地 址 的 PC 的 输 
出 直接 送 到 AB. 使 得 读 一 个 指令 字 能 够 在 一 个 时 钟 周期 完成 。 可 见 AB 的 信息 需要 在 PC 
和 AR 二 者 中 选用 其 一 ,我 们 是 按照 仅 在 读 写 数据 内 存 时 才 送 AR 到 AB, 其 他 情况 都 选 PC 
送 AB。 

标志 位 触发 器 的 接收 会 用 到 flag_c. ce flag_c. clk flag_z. ce、flag_z. clk 这 4 个 语句 。 
标志 位 触发 器 flag_c, 只 在 算术 运算 指令 的 Cexe 周期 才 会 接收 ALU 产生 的 Cy 信号 的 值 ， 
在 执行 逻辑 运算 时 应 该 使 flag_c 一 0, 并 规定 移 位 指令 的 移 位 输出 信号 要 保存 到 flag_c。 标 
志 位 触发 器 flag_z, 只 在 算术 /逻辑 运算 指令 的 Cexe 周期 才 会 接收 ALU 产生 的 Zero 信号 
的 值 。 

(2) 在 MACH 芯片 内 的 组 合 逻 辑 电路 (主要 是 产生 输出 信号 的 CU 电路 ) ,是 选用 真 值 
表 进 行 描述 的 , 真 值 表 的 输入 变量 是 节拍 编码 和 指令 操作 码 ,输出 变量 是 每 一 位 输出 控制 信 
号 , 则 真 值 表 的 每 一 行 能 准确 清楚 地 表明 是 哪 一 条 指令 (依据 指令 操作 码 ) 的 哪 一 个 执行 步 
又 (依据 节拍 编码 ) ,在 真 值 表 中 的 行 、 列 交叉 位 置 给 出 此 时 刻 每 一 位 控制 信号 的 取 值 (0 或 
1) ,这 些 信号 将 送 到 设备 电路 板 上 的 运算 器 .存储器 和 串口 ,控制 它们 完成 指定 的 功能 。 为 
了 提高 程序 的 可 读 性 ,在 真 值 表 的 注释 部 分 .给 出 了 汇编 语句 名 ,本 步骤 需要 完成 的 主要 功 
能 也 包括 如 何 维护 标志 位 触发 器 等 内 容 。 

填写 真 值 表 的 内 容 是 控制 器 设计 的 核心 工作 ,填写 过 程 容易 理解 , 即 遵 照 ABEL 语言 
的 有 关 语 法 和 格式 ,把 指令 执行 流程 表 的 内 容 转 抄 到 这 里 的 真 值 表 中 即 可 完成 ,工作 变 得 简 
单 轻松 ,无 须 设计 者 花费 大 量 的 时 间 和 精力 去 设计 每 一 位 控制 信号 的 逻辑 方程 式 , 而 是 把 这 
项 工作 留 给 工具 软件 来 自行 完成 。 需 要 时 设计 者 还 可 以 随时 查看 到 这 些 逻 辑 方程 式 , 这 对 
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找 出 并 改正 程序 中 的 错误 很 有 帮助 。 下 面 对 这 张 真 值 表 的 内 容 进行 详细 讲解 。 

这 张 真 值 表 的 内 容 由 5 行 组 成 ,每 一 行 的 输入 信号 是 3 位 的 节拍 编码 t_2..t_0 和 8 位 
的 指令 操作 码 IR15.. IR8, 能 准确 清楚 地 表明 此 行 对 应 的 是 哪 一 条 指令 的 哪 一 个 节拍 (操作 
步骤 )。 该 行 输 出 的 是 相关 指令 在 这 一 个 节拍 中 需要 提供 给 运算 器 芯片 的 13 位 信和 号、 提供 
给 内 存 和 串口 芯片 的 3 位 控制 信和 号。 对 这 些 信和 号 的 控制 功能 具体 说 明 如 下 。 

用 于 运算 器 的 13 位 信号 是 aluoe,c0,I8. .1I6,I5..1I3,I2..I0,A_.B_. 其 中 : 

QO@ aluoe 决定 是 否 允 许 送 出 ALU 运算 结果 到 数据 总 线 DB, 低 电 平 有 效 。 当 aluoe 一 0 
时 允许 送 ALU 的 输出 到 DB;aluoe 二 1 时 ALU 的 输出 为 高 阻 态 , 会 断 开 与 DB 的 连接 。 

@ c0 是 送 给 ALU 最 低 一 位 的 进位 输入 信号 ,可 能 为 0 或 者 1, 要 看 指令 这 一 步 的 操作 
功能 。 

@ I8..16, 15..13, I2..10 这 3 组 3 位 信和 号 的 控制 功能 分 别 用 于 选择 对 ALU 结果 的 处 理 
方案 .选择 ALU 的 运算 功能 和 ALU 的 运算 数据 ,具体 用 法 已 经 在 本 教材 第 4 章 的 表 4.1 一 
表 4. 3 中 给 出 ,这 里 不 再 袭 述 。 

@ A_.B_ 表 示 在 读 写 运算 器 中 的 16 个 寄存 器 时 使 用 的 2 组 4 位 的 寄存 器 编码 的 方 
案 , 当 [A_:B =[0,0] 时 ,DR SR 的 编码 来 自 指令 寄存 器 的 IR7 一 IR4 IR3 一 IR0; 当 [A_: 
B 了 =[0,1] 时 ,DR .SR 选择 默认 的 寄存 器 R4( 堆 栈 指针 ); 当 [A_.B_==[1,0] 时 ,DR、SR 
选择 默认 寄存 器 RO( 仅 用 于 IN OUT 指令 ) 。 

用 于 内 存 和 串口 的 3 位 信号 是 MIO .REQ、WE, 其 中 的 MIO=0 表明 需要 内 存 或 串口 
工作 ,MIO=1 表明 不 允许 内 存 或 串口 工作 ; 当 MIO=0 时 ,是 内 存 还 是 串口 工作 决定 于 
REQ, 当 REQ==0 时 是 内 存 工 作 .REQ 二 1 时 是 串口 工作 ; 当 MIO==0 时 ,是 执行 读 操作 还 
是 写 操作 决定 于 WE, 当 WE 二 0 时 是 写 操作 ,WE 一 1 时 是 读 操作 。3 位 信号 的 关系 如 
表 6.2 所 示 。 

表 6.2 3 位 信号 的 关系 

















MIO REQ WE 运行 功能 
0 0 0 内 存 写 
0 0 1 内 存 读 
0 0 串口 写 
0 1 1 串口 读 
1 x x 内 存 与 串口 都 不 运行 











接 下 来 对 真 值 表 的 具体 内 容 详细 说 明 如 下 。 

真 值 表 的 第 1 行 对 应 指令 的 取 指 周期 ,所 以 该 行 的 节拍 编码 为 000, 表 明 是 取 指 周期 ， 
指令 操作 码 是 8 位 的 不 管 位 x, 表 明 此 时 的 操作 功能 与 指令 无 关 。 

其 余 的 4 行 对 应 4 条 指令 的 执行 周期 ,所 以 这 4 行 的 节拍 编码 都 为 010, 表 明 是 指令 的 
执行 周期 ,指令 操作 码 分 别 是 ADD 指令 .AND 指令 ,MVRD 指令 和 JMPA 指令 的 操作 码 。 
接 下 来 可 以 用 前 面 刚 介 绍 过 的 内 容 , 来 分 析 、 判 断 每 一 行 中 输出 的 16 个 信号 实现 的 控制 
功能 。 

第 1 行 执行 到 内 存 读 取 指令 (MIO REQ WE 二 0 0 1) 并 保存 到 IR, 还 要 完成 PC 十 1 的 
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增 量 功能 (在 控制 器 部 件 中 完成 ) ,形成 下 一 条 指令 的 地 址 并 保存 到 PC, 此 时 不 必 使 用 运算 
器 ,有 关 的 某 些 控制 信号 填写 0 值 即 可 ,但 要 确保 运算 器 内 部 寄存 器 内 容 不 被 修改 (18 一 I6 
一 0 0 1) ,要 禁止 ALU 的 输出 送 DB(aluoe 王 1) ,不 影响 用 DB 传送 从 内 存 读 出 的 指令 。 

第 2 行 和 第 3 行 是 双 寄存 器 之 间 的 运算 (I2 一 I0 应 为 0 0 1) ,DR 应 接收 运算 结果 (I8 一 
I6 应 为 0 1 1) ,运算 功能 分 别 是 算术 加 (I5 一 I3 应 为 0 0 0) 和 逻辑 与 (I5 一 I3 应 为 1 0 0) ,无 
内 存 和 串口 读 写 操作 (MIO REQ WE=1 0 0) ,此 时 可 以 送 ALU 的 输出 到 DB(aluoe 二 0)， 
以 便 通过 DB 的 指示 灯 显 示 ALU 的 运算 结果 。 

第 4 行 和 第 5 行 都 是 到 内 存 读 取 双 字 指 令 的 第 2 个 指令 字 (MIO REQ WE=0 0 1) ,第 
4 行 中 的 JMPA 指令 读 出 的 是 指令 转移 地 址 ,需要 保存 到 PC( 在 控制 器 部 件 内 部 完成 ) ,此 
时 不 使 用 运算 器 ,有 关 的 某 些 控制 信号 填写 0 值 即 可 ,但 要 禁止 送 ALU 的 输出 DB(aluoe 一 
1) ,运算 器 内 部 寄存 器 内 容 不 被 修改 。 第 5 行 的 MVRD 指令 从 内 存 读 出 来 的 是 一 个 立即 
数 , 需 要 保存 到 运算 器 的 DR 寄存 器 中 ,要 通过 把 立即 数 D 加 上 0 送 DR 完成 ,因此 I2~I0、 
I5~13、I8~16 应 为 111.000 和 011。 

这 里 要 补充 说 明 以 下 4 个 问题 。 

(1) 这 个 程序 实现 的 4 条 指令 是 实现 全 部 30 条 基本 指令 的 ABEL 程序 的 一 部 分 ,这 样 
做 是 为 了 使 这 个 程序 尽 可 能 地 精简 ,方便 学 生 学 习 和 理解 ,更 是 为 了 给 学 生 扩展 新 指令 留 下 
足够 的 选择 空间 。 在 此 基础 上 ,每 扩展 一 条 指令 进去 ,只 需 在 现 有 的 ABEL 程序 中 增加 或 
修改 很 少数 的 语句 ( 几 行 文字 ) 即 可 完成 。 

(2) 若 实现 的 不 是 全 部 30 条 指令 ,监控 程序 就 运行 不 起 来 的 ,需要 找 出 怎样 向 实验 计 
算 机 送 入 调试 程序 的 办 法 ,可行 办 法 之 一 是 在 MACH 芯片 内 实现 一 个 小 ROM 电路 ( 仅 16 
个 字 ) ,用 于 编辑 和 保存 学 生 设计 的 调试 程序 ,这 个 小 ROM 电路 很 容易 使 用 一 张 真 值 表 进 
行 描述 ,其 输入 信息 是 PC3 一 PC0, 输 出 信息 是 16 位 的 指令 代码 。 此 时 要 解决 的 问题 是 , 指 
令 不 再 是 从 内 存 芯 片 读 出 ,而 是 由 小 ROM 提供 ,这 容易 在 ABEL 程序 中 处 理 。 小 ROM 中 
的 程序 只 能 使 用 指令 代码 ,指令 的 运行 步骤 控制 信号 的 状态 .运行 结果 只 能 通过 查看 指示 
灯 来 了 解 。 

(3) 也 可 以 考虑 把 时 序 电 路 的 接收 使 能 需求 也 直接 表示 在 真 值 表 中 ,就 像 微 程序 控制 
器 中 采用 的 办 法 ,我 们 没有 这 样 做 ,一 是 希望 使 真 值 表 的 输出 信和 号 的 位 数 尽量 少 ;二 是 要 求 
学 生 能 够 初步 体验 到 写 信 号 逻辑 方程 的 过 程 和 具体 办 法 ,好 在 这 并 不 太 难 ,在 真 值 表 的 注释 
部 分 又 给 出 了 每 一 条 指令 的 每 一 个 步骤 的 执行 功能 。 


6.3 微 程序 控制 器 部 件 


微 程序 控制 器 是 控制 器 中 的 一 种 常用 类 型 。1951 年 ,英国 剑桥 大 学 的 M. V. Wilkes 
教授 首次 提出 了 微 程序 控制 的 概念 ,其 后 陆续 有 人 加 入 了 研究 的 行列 并 取得 重大 进展 ,但 由 
于 找 不 到 保存 微 程序 内 容 的 器 件 而 不 能 使 用 。 随 着 半导体 器 件 的 出 现 和 发 展 , 有 了 速度 较 
快 的 存储 器 介质 , 微 程序 控制 器 进入 了 实用 阶段 ,于 1964 年 4 月 ,使 用 微 程序 控制 器 的 
IBM360 计算 机 研制 成 功 ,其 后 在 性 能 要 求 不 是 特别 高 的 系列 计算 机 系统 中 得 到 普遍 应 用 。 
其 缺点 是 运行 速度 较 慢 ,难以 在 性 能 要 求 特别 高 的 计算 机 系统 中 使 用 。 它 的 基本 运行 原理 ， 
是 用 多 条 微 指令 “解释 ”每 一 条 指令 的 功能 。 硬件 组 成 中 的 核心 线路 是 一 个 被 称 为 控制 存储 


第 
© 
章 





计算 机 组 成 与 体系 结 攀 (第 3 版 ) 





器 的 部 件 ( 使 用 ROM 器 件 实现 ) ,用 于 保存 由 微 指令 (指令 一 个 执行 步 又 用 到 的 控制 信号 的 
集合 ) 组 成 的 微 程序 。 在 程序 执行 过 程 中 .将 按照 指令 及 其 执行 步骤 ,依次 从 控制 存储 器 中 
读 出 一 条 微 指令 ,用 微 指令 中 的 微 命令 字段 控制 各 执行 部 件 的 运行 功能 ,并 用 下 地 址 字段 形 
成 下 一 条 微 指令 的 地 址 ,使 得 微 程序 可 以 连续 运行 。 


6.3.1 微 程序 控制 器 的 基本 组 成 和 运行 原理 
微 程序 控制 器 的 计算 机 硬件 系统 组 成 如 图 6. 10 所 示 ,虚线 框 内 的 部 分 是 控制 器 部 件 。 
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图 6.10 选用 微 程序 控制 器 的 计算 机 硬件 系统 组 成 


从 图 6. 15 中 可 以 看 到 , 微 程序 控制 器 由 4 个 子 部 件 组 成 。 

(1) 第 1 个 是 程序 计数 器 PC, 用 于 保存 一 条 指令 在 内 存 中 的 地 址 ,服务 于 读 取 指 令 , 通 
常 需要 有 增 量 功能 ,并 可 接收 改变 指令 执行 次 序 的 指令 地 址 。PC 的 内 容 是 下 一 条 将 要 执 
行 的 指令 在 存储 器 中 的 单元 地 址 ,解决 的 是 按照 程序 中 规定 的 指令 次 序 有 序 读 出 指令 的 
问题 。 

(2) 第 2 个 是 指令 寄存 器 IR, 用 于 保存 从 内 存 读 来 的 指令 内 容 , 以 便 提供 执行 指令 的 过 
程 中 要 用 到 的 指令 本 身 的 主要 信息 。 

(3) 第 3 个 是 控制 存储 器 (简称 控 存 ) 和 微 指令 寄存 器 , 控 存 用 于 保存 微 程序 , 微 指令 寄 
存 器 暂 存 从 控 存 中 读 出 的 一 条 微 指令 ,设置 微 指令 寄存 器 可 以 提高 微 程序 的 执行 速度 。 控 
制 存储 器 提供 类 似 于 硬 布线 控制 器 中 的 控制 信号 产生 部 件 的 功能 。 

(4) 第 4 个 是 微 指令 下 地 址 线路 ,用 于 向 控制 存储 器 提供 读 操作 使 用 的 地 址 ,解决 的 是 
读 出 和 执行 微 指 令 的 次 序 问题 。 这 个 地 址 值 与 指令 操作 码 、 微 指令 字 中 下 地 址 字段 的 内 容 
等 有 关 。 下 地 址 线路 提供 类 似 于 硬 布线 控制 器 中 的 节拍 发 生 器 的 功能 。 

要 理解 微 程序 控制 器 的 运行 原理 .首先 需要 明确 指令 和 微 指令 的 关系 与 区 别 , 从 它们 的 
内 容 组 成 和 所 实现 功能 两 个 方面 来 看 ,指令 和 微 指令 属于 不 同 层面 上 的 概念 。 

指令 是 指示 计算 机 硬件 系统 完成 一 项 最 基本 的 运算 或 者 操作 功能 的 命令 ,使 用 的 全 部 
指令 组 成 一 台 计算 机 的 指令 系统 ,用 于 设计 完成 各 种 计算 任务 或 者 信息 管理 等 功能 的 程序 ， 


挫 制 器 部 件 


运行 中 的 程序 将 保存 在 主 存储 器 中 。 指 令 是 程序 设计 人 员 与 计算 机 系统 沟通 和 交互 的 
媒介 。 

微 指 令 则 是 直接 控制 计算 机 硬件 线路 完成 指令 功能 的 控制 信号 的 集合 ,被 划分 为 微 命 
令 字 段 和 下 地 址 字段 两 大 部 分 。 计 算 机 厂家 用 微 指令 设计 “解释 ”每 一 条 指令 执行 过 程 的 微 
程序 , 微 程 序 被 固化 在 控制 存储 器 中 。 微 指令 是 计算 机 指令 和 硬件 电路 之 间 建 立 联 系 的 媒 
介 , 计 算 机 的 使 用 人 员 通 常 接触 不 到 微 程序 和 微 指令 的 内 容 。 

可 以 从 以 下 几 个 角度 来 理解 微 程序 控制 器 的 基本 组 成 和 运行 原理 。 

(1) 有 关 程 序 计数 器 PC 和 指令 寄存 器 IR 的 功能 已 经 在 硬 布线 控制 器 的 章节 讲解 过 ， 
在 微 程序 控制 器 中 没有 变化 ,在 此 不 再 缆 述 。 

(2) 在 计算 机 系统 中 ,执行 每 一 条 指令 ,都 要 经 过 读 取 指 令 、 分 析 指令 .执行 这 条 指令 规 
定 的 具体 操作 功能 (这 里 可 能 还 要 再 分 为 几 个 步骤 ) 等 操作 步骤。 在 征程 序 控制 器 中 ,指令 
的 每 一 个 执行 步骤 被 称 为 一 个 微 周期 (又 称 CPU 周期 ) ,完成 一 项 或 几 项 运算 或 操作 (此 处 
称 其 为 微 操作 ) 功 能 ,要 使 用 一 条 微 指 令 提 供 控制 计算 机 各 部 件 完成 这 些微 操作 的 控制 信号 
(可 能 有 几 十 位 到 一 二 百 位 ) ,执行 一 条 机 器 指令 所 使 用 的 几 条 微 指令 组 合成 一 段 微 程序 。 
整个 指令 系统 使 用 的 全 部 微 程序 ( 几 十 、 几 百 条 或 更 多 ) 被 有 序 地 整合 成 一 个 整体 ,并 被 固化 
在 控制 存储 器 中 ,这 个 控制 存储 器 是 微 程序 控制 器 的 核心 部 件 。 在 需要 用 到 哪 一 条 微 指令 
的 时 候 ,要 将 其 从 控制 存储 器 中 读 出 ,首先 将 其 保存 到 微 指令 寄存 器 ,之 后 再 把 微 指令 各 字 
段 中 的 控制 信号 传送 到 计算 机 的 各 功能 部 件 。 设 置 微 指 令 寄存 器 是 必要 的 ,使 执行 本 条 微 
指令 和 读 出 下 条 微 指令 这 两 项 操作 的 时 间 重 县 起 来 ,避免 先 用 一 段 时 间 读 出 微 指令 , 再 用 一 
段 时 间 执 行 微 指令 ,从 而 提高 了 微 指令 的 执行 速度 。 

(3) 在 微 程序 控制 器 中 ,要 通过 微 指令 下 地 址 线路 提供 下 一 条 微 指令 在 控 存 中 的 地 址 ， 
表示 和 得 到 下 条 微 指令 地 址 有 多 种 方案 ,更 多 内 容 将 在 6. 3. 2 节 讲 解 。 从 图 6. 10 可 以 看 
到 ,下 地 址 线路 把 指令 的 操作 码 和 微 指令 中 下 地 址 字段 的 信息 作为 输入 ,输出 的 就 是 一 条 微 
指令 的 地 址 并 送 到 控制 存储 器 。 微 指令 的 内 容 被 划分 为 下 地 址 字段 (提供 形成 下 条 微 指令 
地 址 的 有 关 信 息 . 可 能 被 细 化 为 几 个 更 小 的 字段 ,用 于 控制 器 部 件 本 身 ) 和 微 命令 字段 (由 多 
个 更 小 的 字段 给 出 多 位 的 控制 信号 ,用 于 控制 计算 机 的 各 执行 部 件 ,如 运算 器 ,存储 器 、 接 
口 .总 线 等 协同 运行 )。 

以 执行 一 条 ADD 加 法 指令 为 例 ,看 如 何 通 过 微 程序 实现 对 这 条 指令 执行 过 程 的 控制 ， 
如 图 6.11 所 示 。 先 假定 指令 格式 由 操作 码 OP 和 2 个 寄存 器 (编号 B、A) 组 成 ,实现 的 功能 
为 B<-(B) 十 (A), 即 寄存 器 B 的 内 容 与 寄存 器 A 的 内 容 相 加 ,再 把 运算 结果 保存 回 寄存 器 
ADD 指 令 的 
执行 步骤 读 取 指令 读 寄存 器 堆 ALU 加 运算 结果 写 回 


生 指 人 的 做。 指 信 地 直送 寺 在 人 器 天 人 制 功能 但 圳 | 恋 过 丰 路 堆 并 缓存 | 人生 加 法 运 和 | 结果 所 罗 守 存 器 堆 
微 指 仿 站 人 绍 的 做 命令 ， 读 存储 器 | 要 保证 各 寄存 器 的 | 的 微 命令 的 微 合 的 微 命令 
内 容 的 微 命令 ， 指 令 寄存 | 内 容 不 被 修改 

器 接收 的 微 命令 ， 实 

现 PC~PCT 的 做 命令 








微 指令 的 下。 顺序 执行 下 一 条 全 指 | 按 指令 操作 码 转 到 | 顺序 执 行 下 一 条 微 | 顺序 执行 下 一 条 做 | 无 条 件 转移 到 下 一 
二 人 的 村 二 信息 | 对 的 人 各 序 约 标 指标 志 们 息 。 指 人 的 标志 信 息 | 条 的 了 请 


图 6.11 ADD 指令 的 执行 步骤 和 用 到 的 几 条 微 指令 
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B 中 。 指 令 选用 4 个 执行 步骤 的 方案 完成 : 读 取 指令 并 完成 PC 增 量 ; @ 读 寄存 器 组 中 
的 两 个 数据 并 缓存 ; @ALU 运算 并 缓存 结果 ; @ 结 果 写 回 寄存 器 B。 为 此 需要 使 用 4 条 微 
指令 提供 这 4 个 步骤 用 到 的 控制 信号 ,这 4 条 微 指令 都 要 在 微 命令 字段 和 下 地 址 字段 给 出 
两 类 不 同 用 途 的 信息 。 在 微 命令 字段 给 出 的 是 控制 计算 机 各 部 件 完 成 ADD 指令 功能 的 控 
制 信号 ,下 地 址 字段 给 出 的 是 指明 微 指令 之 间 执 行 次 序 (彼此 之 间 的 连接 方式 ) 的 有 关 信 息 。 
从 图 6. 16 中 可 以 看 到 ,在 读 取 指 令 和 读 寄存 器 堆 两 个 步 又 之 间 插 入 了 一 条 微 指令 ,是 运行 
微 程序 控制 器 所 要 求 的 。 因 为 在 取得 指令 之 后 ,需要 用 指令 操作 码 形成 对 应 本 条 指令 的 微 
程序 的 首 地 址 ,并 从 控制 存储 器 中 读 出 这 条 微 指令 ,这 个 读 操作 需要 占用 一 个 微 周 期 才能 完 
成 ,此 期 间 计 算 机 各 执行 部 件 处 于 空闲 状态 。 因 此 这 条 指令 实际 上 是 用 5 个 步 又 完成 的 。 

几 条 微 指令 之 间 的 执行 次 序 ,是 通过 微 指令 地 址 的 连接 方式 体现 出 来 的 。 第 1 条 微 指 
令 的 地 址 是 由 上 一 条 机 器 指令 的 最 后 一 个 执行 步骤 准备 好 的 ,完成 的 是 两 条 机 器 指令 之 间 
的 衔接 关系 。 若 在 控制 存储 器 中 ,把 第 2 条 微 指令 排 在 第 1 条 微 指令 的 后 面 , 则 只 需 在 第 1 
条 微 指令 的 下 地 址 字段 中 指定 顺序 执行 方式 ; 同 理 , 第 3 条 微 指令 结束 时 进 到 第 4 条 微 指 
令 , 第 4 条 微 指 令 结束 时 进 到 第 5 条 微 指令 都 可 以 选用 顺序 执行 方式 实现 。 第 5 条 微 指令 
则 要 在 自己 的 下 地 址 字段 指定 无 条 件 地 转移 到 第 1 条 微 指令 ,以 便 进 到 下 一 条 机 器 指令 的 
取 指 步 又。 但 在 处 理 第 2 条 微 指 令 进 到 第 3 条 微 指令 的 时 候 略 显 复杂 ,需要 在 第 2 条 微 指 
令 的 下 地 址 字段 指 定 按 指令 操作 码 实现 功能 分 支 ,需要 用 到 一 个 专用 的 线路 把 指令 操作 码 
映射 成 对 应 的 微 程序 入 口 地 址 ,用 这 个 地 址 去 读 控制 存储 器 , 读 出 对 应 这 条 机 器 指令 的 微 程 
序 的 首 条 微 指令 。 综 上 所 述 ,这 里 的 5 条 微 指令 中 的 前 2 条 公用 于 所 有 指令 ,是 执行 每 一 条 
机 器 指令 必须 经 过 的 操作 步骤 ;后 面 的 3 条 可 以 依据 指令 不 同 而 不 相同 。 


6.3.2 人 微 程序 设计 中 的 下 地 址 形成 逻辑 和 微 程 序 设计 


1. 得 到 下 一 条 微 指令 地 址 的 有 关 技 术 

要 保证 微 指令 逐条 有 序 执行 ,就 必须 在 本 条 微 指令 的 执行 过 程 中 ,可 取 来 或 临时 形成 
(产生 ) 下 一 条 微 指令 的 地 址 ;从 运行 效率 考虑 , 稍 后 还 应 能 用 此 地 址 把 下 一 条 微 指令 的 内 容 
从 控制 存储 器 中 读 出 来 ,以 便 在 本 条 微 指令 结束 后 ,能 尽快 地 进入 下 一 条 微 指令 的 执行 
过 程 。 

决定 下 一 条 微 指令 地 址 (简称 下 地 址 ) 的 因素 较 多 ,处 理 办 法 各 不 相同 ,具体 包括 以 下 几 
个 方面 。 

(1) 微 程序 顺序 执行 时 .下 地 址 为 本 条 微 指令 地 址 加 1。 

(2) 在 微 程序 必定 转向 某 一 微 地 址 时 ,可 以 在 微 指 令 字 中 的 下 地 址 字段 中 给 出 该 地 
址 值 。 

(3) 按 微 指令 (上 一 条 或 本 条 ) 的 某 一 执行 结果 的 状态 ,选择 顺序 执行 或 转向 某 一 地 址 ， 
此 时 必须 在 微 指 令 字 中 指明 判断 所 依据 的 条 件 及 转移 地 址 。 要 判断 的 条 件 , 可 以 是 运算 器 
的 标志 位 状态 ,控制 器 的 执行 状态 ,如 多 次 的 微 指 令 循环 是 否 结束 ,外 设 是 否 请 求 中 断 等 。 

(4) 微 子 程序 的 调用 及 返回 控制 ,会 用 到 微 堆栈 。 

(5) 依 条 件 判断 转向 多 条 微 指 令 地 址 中 的 某 一 地 址 的 控制 , 它 可 以 是 前 述 第 (3) 条 的 更 
复杂 一 点 的 用 法 。 

(6) 依据 取 来 的 机 器 指令 的 操作 码 ,找到 对 应 该 条 指令 的 执行 过 程 的 一 段 微 程序 的 人 
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口 地 址 。 这 种 情况 ,通常 被 称 为 微 程序 控制 中 的 功能 分 支 转移 。 

从 上 述 讨论 中 可 以 看 出 ,要 得 到 下 一 条 微 指令 的 地 址 ,至 少 得 从 以 下 两 个 方面 人 手 。 

(1) 要 在 微 指令 的 下 地 址 字段 中 ,分 配 相 应 的 几 个 字段 ,用 于 给 出 微 指令 转移 地 址 ( 完 
整 的 一 个 地 址 ,或 部 分 的 多 个 地 址 ) ,以 及 是 顺序 执行 .无 条 件 转移 或 条 件 转移 及 其 判断 条 
件 , 是 否 是 功能 转移 ,是 否 是 微 子 程序 调用 或 返回 等 。 

(2) 应 有 专门 的 硬件 线路 支持 ,用 于 实现 诸如 微 指 令 地 址 加 1, 依据 判断 条 件 给 出 判定 
结果 为 真 还 是 为 假 , 给 出 微 堆栈 组 织 并 实现 入 /出 微 堆栈 管理 ,解决 指令 操作 码 与 相关 微 程 
序 段 的 对 应 关系 ,以 实现 微 程序 中 的 功能 分 支 。 例 如 ,Am2910 芯片 就 是 用 于 形成 下 一 条 微 
指令 地 址 的 非常 典型 的 核心 硬件 。 

2. Am2910 芯片 的 功能 和 内 部 组 成 

Am2910 是 一 片 能 提供 12 位 微 指令 地 址 的 器 件 , 即 它 的 输入 输出 的 地 址 位 数 和 器 件 内 
的 部 件 位 数 均 为 12 位 ,能 直接 寻 址 4096 条 微 指令 字 的 空间 范围 ,其 内 部 结构 如 图 6. 12 
所 示 。 
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图 6.12 Am2910 内 部 结构 框图 


1) Am2910 的 内 部 组 成 

(1) Am2910 包括 一 个 4 输入 的 多 路 地 址 选择 器 ,用 来 从 寄存 器 /计数 器 (R/C) 、 直 接 输 
入 (D) 、 微 程序 计数 器 (jyPC) 或 微 堆栈 (F) 这 4 个 输入 中 ,选择 其 一 作为 下 一 条 微 指令 的 
地 址 。 

(2) 寄存 器 /计数 器 由 12 个 D 型 触发 器 组 成 。 当 它 用 作 寄 存 器 时 ,主要 用 于 保存 一 个 
微 地 址 ,用 以 实现 微 程序 转移 ; 当 它 用 作 计 数 器 时 .具有 减 1 功能 ( 何 时 减 1, 取 决 于 Am2910 
的 命令 码 ) , 主要 用 于 控制 微 程序 的 循环 次 数 , 若 装 和 人 的 初 值 为 N, 则 可 能 执行 N 十 1 次 
循环 。 

(3) 微 程序 计数 器 由 12 位 的 增 量 器 和 12 位 的 寄存 器 PC 组 成 。 当 增 量 器 的 进位 输入 
CI 为 高 电 平 时 ,多 路 器 的 输出 Y 加 1 后 装 入 uPC( 即 xyPC<Y 十 1) ,用 于 实现 微 程序 的 顺序 
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执行 ;而 当 CI 为 低 电 平时 ,多 路 器 的 输出 Y 直接 装 入 pPC( 即 xPC<Y) ,用 于 实现 同一 条 微 
指令 的 多 次 执行 。 

(4) 微 堆栈 是 由 5 字 X12 位 的 寄存 器 堆栈 和 微 堆栈 指针 pSP 组 成 ,主要 用 于 保存 微 子 
程序 调用 时 的 返回 地 址 和 微 程序 循环 的 首 地 址 。 微 堆栈 指针 pSP 总 是 指向 最 后 一 次 压 和 人 
的 数据 ,因此 ,执行 微 程序 循环 时 ,允许 不 执行 弹出 操作 而 直接 访问 微 堆栈 的 栈 项 。 当 微 堆 
栈 中 的 数据 达到 5 个 时 ,就 发 出 微 堆栈 已 满 信号 (FULL 王 0) ,这 时 ,任何 压 人 操作 都 将 覆盖 
掉 栈 顶 的 原 有 数据 。 

(5) 命令 译 码 器 接收 外 部 送 来 的 命令 码 五 一 五, 条 件 输入 GC 和 条 件 允 许 CCEN 信 号 ,并 
对 其 译 码 ,产生 芯片 内 工作 需要 的 控制 信号 和 外 部 要 用 的 3 个 控制 选择 信号 PL、MAP 和 
VECT。3 个 输出 信和 号 PL、MAP 和 VECT 用 于 决定 外 部 直接 输入 D 的 来 源 。 

当 PL 有 效 时 ( 即 PL 二 0),D 来 源 于 微 指令 的 下 地 址 字段 ,用 于 给 出 微 程序 转移 地 址 。 

当 MAP 有 效 时 ( 即 MAP=0) ,D 来 源 于 MAPROM., 用 于 实现 从 机 器 指令 的 操作 码 找到 
相应 的 微 程序 段 首 地 址 ; 当 VECT 有 效 时 ( 即 VECT= 二 0) ,原意 是 来 源 于 向 量 , 现 直接 接地 ， 
未 使 用 。 

2) Am2910 引 脚 的 定义 

(1) 输入 信号 

Q@ Du ~Do: 外 部 直接 输入 的 数据 , 既 可 作为 寄存 器 /计数 器 的 初 值 ,也 可 以 经 过 地 址 
多 路 选择 器 直接 从 Y 输出 .作为 下 一 条 微 指令 的 地 址 。 

@ 有 一 和 :Am2910 的 命令 码 , 来 自 微 指 令 字 相关 字段 ,用 以 选择 Am2910 的 16 条 
命令 。 

@ CCEN 和 CC: 共同 确定 测试 条 件 是 否 通过 , 若 CCEN 为 低 且 CC 为 高 , 则 指明 测试 失 
效 ;而 CCEN 为 高 或 CC 为 低 , 均 表明 测试 通过 。 若 把 CCEN 接 地 ,即使 其 恒 为 低 电 平 , 则 可 以 
只 使 用 CC 判断 测试 结果 ,CC 为 低 是 测试 通过 ,CC 为 高 则 表明 测试 失效 ,我 们 在 实验 计算 机 
中 就 是 这 样 用 的 。 此 时 它 与 命令 码 I; ~ 了 共同 决定 给 出 下 一 条 微 指令 地 址 的 方案 和 对 堆 
栈 的 操作 。 

@ RLD: 寄存 器 /计数 器 装 入 信号 , 当 其 为 低 电 平时 ,不 管 Am2910 所 执行 的 命令 和 测 
试 条 件 如 何 ,都 强制 把 直接 输入 Du 一 D。 装 入 Am2910 内 部 的 寄存 器 /计数 器 。 

@ CI: 增 量 器 进位 输入 , 当 其 为 高 电 平时 ,控制 微 指 令 地址 增 量 , 即 执行 xPC<Y 十 1， 
当 其 为 低 电 平时 .执行 yPC<Y。 

@ 0E: Y 输出 允许 信号 , 低 电 平 有 效 , 当 为 高 电 平时 ,Y 输出 为 高 阻 态 。 

@ CP: 时 钟 脉冲 信号 ,由 低 变 高 的 上 升 边沿 触发 所 有 内 部 状态 的 变化 。 

(2) 输出 信号 

Q@ Yn ~Y。: 下 一 条 微 指令 的 地 址 , 它 直 接 被 用 作 读 控制 存储 器 的 地 址 。 

@ FULL: 微 堆栈 满 信号 , 低 电 平 有 效 。 

@ PL,MAP.VECT: 3 个 使 能 信号 ,用 于 决定 直接 输入 DD 的 3 个 来 源 , 加 上 芯片 内 的 
多 路 地 址 选择 器 的 另外 3 个 输入 尺 .FuFC,Yn~Y。 是 经 过 6 选 1 得 到 的 。 

3) Am2910 芯片 的 功能 与 具体 用 法 

表 6.3 给 出 了 Am2910 所 完成 的 部 分 功能 ,这 些 功能 由 命令 码 I ~ 了 1、 条 件 输入 CC 和 
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CCEN 以 及 计数 器 当前 值 的 组 合 结果 来 决定 。 

Am2910 提供 了 16 条 命令 ,用 来 控制 Am2910 内 部 的 操作 和 选择 下 一 条 将 要 执行 的 微 
指令 的 地 址 。 其 中 只 有 少数 命令 (如 0,2 和 14 号 命令 ) 的 执行 结果 仅 由 命令 码 本 身 决定 ,大 
部 分 命令 还 都 要 受到 测试 条 件 (CC 和 CCEN) 为 真 还 是 为 假 的 控制 ,有 些 命令 (如 8,9 和 15 
号 命令 ) 的 执行 结果 , 则 要 受到 内 部 计数 器 当前 值 是 否 为 零 的 控制 ,其 中 15 号 命令 同时 受到 
内 部 计数 器 的 值 是 否 为 零 和 测试 条 件 是 否 通过 的 双重 控制 ,以 实现 3 路 微 程序 转移 的 功能 。 

现 将 实验 计算 机 设计 中 要 用 到 的 0,2,3,14 这 4 条 命令 的 功能 和 我 们 的 具体 用 法 说 明 如 下 。 

(1) 0 号 命令 。 用 于 初始 化 , 即 无 条 件 清除 内 部 微 堆栈 ,并 使 Y 的 输出 一 定 为 零 ,用 于 
系统 加 电 时 ,确保 此 时 系统 从 0 号 微 地 址 开始 执行 微 程序 。 

(2) 2 号 命令 。 用 于 指令 功能 分 支 , 即 输出 信号 MAP 为 低 ,使 DD 输入 信号 从 MAPROM 
( 微 地 址 映射 部 件 ) 得 到 ,并 将 其 作为 输出 微 地 址 Y 的 值 ,实现 用 指令 操作 码 找到 对 应 该 指 
令 的 微 程序 段 的 人口 地 址 ,从 而 开始 该 条 指令 的 执行 过 程 。 

(3) 3 号 指令 。 用 于 条 件 微 转移 控制 , 当 条 件 成 立 , 即 CC 为 低 时 ,用 PL 把 微 指令 字 中 的 
下 地 址 字段 的 内 容 ( 转 移 地 址 ) 经 过 DD 输入 并 送 到 YY, 实现 微 程序 转 移 。 当 CC 为 高 时 , 微 程 
序 顺 序 执行 , 即 把 已 增 1 后 的 微 指令 地 址 作为 下 地 址 。 若 外 部 电路 确保 送 入 的 CC 的 状态 为 
低 ,3 号 条 件 微 转移 命令 也 可 以 用 于 实现 无 条 件 的 微 程序 转移 来 使 用 。 

(4) 14 号 命令 。 顺 序 执行 , 即 执行 紧 跟 在 本 条 微 指 令 后 面 的 那 条 微 指令 。 


表 6.3 Am2910 器 件 的 功能 控制 


























CCEN=0 
指令 号 | 。 完成 功能 | We | 亲人 | 全 区 高 To 
Y 输出 堆栈 Y 输出 堆栈 
0 初始 化 / PL 0 清除 0 清除 
2 指令 功能 分 支 / MAP D / D / 
3 条 件 转 移 f PL nPC / D x 
14 顺序 执行 / PL PPC / PPC / 


























说 明 : @ 若 测试 失败 则 保持 ,否则 就 装 数 ;pPC 一 一 微 指令 计数 器 ; D 一 一 直接 输入 ;R/C 一 一 寄存 器 /计数 器 。 四 图 
中 符号 “/" 表 示 保 持原 内 容 不 变 。 


6.3.3 TEC-XP- 开 教学 计算 机 的 微 程序 控制 器 的 设计 与 实现 


设计 一 台 计算 机 的 首要 任务 是 确定 设计 目标 和 市 场 定 位 ,包括 系统 的 性 能 与 经 济 指标 ， 
指令 格式 和 指令 系统 ,总 体 技术 方案 等 。 

其 次 是 初步 设计 系统 的 硬件 构成 ,设计 并 通过 仿真 测试 指令 系统 ; 细 化 系统 硬件 结构 ， 
划分 指令 执行 步骤 并 确定 每 一 步骤 的 功能 ;确定 计算 机 各 部 件 需 要 使 用 的 控制 信号 ,设计 微 
指令 格式 ,包括 下 地 址 字段 和 微 命令 字段 的 内 容 组 成 。 

接 下 来 是 设计 微 程序 的 内 容 , 其 中 微 命令 字段 的 划分 和 实现 的 控制 功能 非常 类 似 于 硬 
布线 控制 器 的 设计 结果 ,此 处 不 再 袭 述 。 微 指令 字 中 下 地 址 字段 的 内 容 选 择 和 使 用 方法 是 
微 程序 控制 器 设计 的 特殊 内 容 。 
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最 后 一 步 是 把 设计 的 微 程序 中 的 每 一 条 微 指令 都 安排 到 控制 存储 器 的 一 个 存储 单元 
中 ,这 一 设计 步骤 可 能 要 反复 几 次 ,在 微 指令 的 下 地 址 字段 的 内 容 和 这 条 微 指令 在 控制 存储 
器 中 的 地 址 之 间 建 立正 确 的 对 应 关系 ,包括 指令 的 操作 码 与 对 应 这 条 指令 具体 操作 功能 的 
微 程 序 段 的 入口 地 址 的 对 应 关系 。 

设计 完 之 后 ,将 进入 调试 修改 的 阶段 ,直到 得 到 满意 的 设计 与 运行 结果 。 

在 有 了 能 力 很 强 的 硬件 描述 语言 的 软件 工具 和 高 集成 度 的 可 编程 芯片 之 后 ,设计 实现 
硬 布线 的 控制 器 或 者 微 程序 的 控制 器 都 不 再 那么 困难 。 

教学 计算 机 系统 实现 了 硬 布 线 和 微 程序 两 种 方案 的 控制 器 ,是 采用 两 个 独立 的 ABEL 
程序 分 别 设计 的 。 在 设计 的 整个 过 程 中 ,特别 强调 保持 二 者 之 间 尽 可 能 多 的 一 致 性 。 例 如 
力争 做 到 使 微 指令 字 中 的 微 命令 字段 的 构成 及 具体 内 容 与 硬 布 线 控制 器 的 控制 信号 尽量 保 
持 一 致 , 则 在 实现 了 硬 布线 控制 器 之 后 ,其 设计 结果 的 很 大 一 部 分 内 容 可 以 较为 简单 地 复制 
到 微 程序 的 控制 器 中 。 下 面 给 出 这 个 微 程序 控制 器 的 设计 结果 ,在 图 6. 13 给 出 了 微 程 序 的 
结构 和 微 指令 的 执行 流程 ,之 后 给 出 描述 微 程序 控制 器 组 成 及 其 功能 的 ABEL 程序 的 部 分 
内 容 , 程 序 中 加 了 比较 多 的 注释 ,在 程序 之 后 还 要 对 其 中 的 关键 语句 进行 简要 说 明 。 

教学 计算 机 实现 的 是 在 本 教材 的 5. 3. 4 节 讲 解 过 的 实验 计算 机 的 30 条 基本 指令 ,被 划 
分 为 A、B.D 这 3 组 ,分 别 用 2 个 ,3 个 .4 个 步骤 完成 ,这 几 个 步 又 分 别称 为 取 指 步 又 、 执 行 
步骤、 存储 器 读 写 步骤 -1 和 存储 器 读 写 步 又 2, 已 经 在 图 6. 13 中 表示 清楚 。 在 微 程序 控制 
器 中 ,指令 的 每 一 个 步骤 要 用 到 一 条 微 指令 , 取 指 操作 公用 于 所 有 指令 ,使 用 一 条 微 指 令 ; 取 
指 之 后 ,指令 进入 具体 功能 的 执行 阶段 ,21 条 A 组 指令 在 执行 步骤 通常 应 各 用 一 条 微 指令 ， 
但 由 于 5 条 相对 转移 指令 可 以 合用 一 条 微 指令 , 故 A 组 指令 共 使 用 了 17 条 微 指令 ;8 条 B 
组 指令 各 使 用 2 条 微 指令 , 先 在 执行 步 又 准备 内 存 地 址 ,后 到 存储 器 读 写 步 又 -1 完成 读 写 
操作 ,合计 使 用 16 条 微 指令 ;CALA 指令 用 3 个 步骤 完成 ,要 用 3 条 微 指 令 , 在 执行 步骤 取 
子 程序 人 口 地 址 到 PC 并 和 暂 存 主 程序 断 点 ,在 存储 器 读 写 步 骤 _1 修改 堆栈 指针 并 送 AR ,在 
存储 器 读 写 步骤 2 写 主 程序 断 点 进 堆栈 。 

有 3 件 事 情 需要 再 次 澄清 。 

(1) 在 微 程序 控制 器 中 , 取 指 之 后 需要 用 一 个 步 又 完成 指令 的 功能 分 支 操作 ,就 是 使 用 
由 指令 操作 码 映 射出 的 微 指令 地 址 去 读 控制 存储 器 ,以 便 得 到 对 应 刚 读 出 的 那 条 指令 要 用 
到 的 微 指令 ,此 时 计算 机 各 执行 部 件 由 于 尚 无 得 到 需要 的 控制 信号 而 处 于 空闲 状态 。 

(2) 需要 正确 给 出 微 程序 的 首 地 址 ,可 以 在 系统 复位 ( 按 下 设备 的 RESET 按键 ) 时 ,把 
取 值 为 0000 的 命令 码 CI 一 CL 送 到 Am2910 芯片 , 则 芯片 会 送出 Y? 一 Yo 为 全 0 的 控 存 地 
址 ,使 微 程序 从 0# 微 指令 开始 运行 ,之 后 微 指令 的 下 地 址 电路 就 会 自行 提供 出 下 条 微 指令 
地 址 ,确保 微 程序 得 以 连续 运行 。 

(3) 在 系统 复位 时 还 把 PC 内 容 清 0, 使 系统 启动 后 将 从 内 存 的 0 地 址 启动 监控 程序 。 

确定 微 指 令 的 格式 很 重要 ,我 们 的 方案 是 使 用 34 位 字 长 的 微 指令 ,分 为 3 个 大 字段 。 

(1) 微 指令 的 下 地 址 信息 字段 ,占用 11 位 〈 可 以 变化 ) ,包括 6 位 的 微 指令 的 转移 地 址 
nadr5~nadr0,Am2910 的 4 位 命令 码 CI3 一 CI0.1 位 的 微 指令 是 否 转移 的 条 件 码 -CC 。 

(2) 时 序 电路 的 输入 控制 字段 ,占用 7 位 ,时 序 电路 包括 flag_c、flag_z、pcar 的 接收 控 
制 信号 ,包括 flg_c2~flg_c0,pc_cl~pc_c0,ar.c 共 6 位 , 另 一 位 ar_AB 信号 用 于 选择 送 地 
址 总 线 AB 的 信息 来 源 。 


然 6 几 
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(3) 微 指令 字 的 微 命令 字段 ,占用 16 位 ,与 硬 布线 控制 器 使 用 的 16 位 的 控制 信号 完 
相同 ,因此 可 以 把 硬 布线 控制 器 的 设计 结果 简单 地 复制 到 微 程序 控制 器 的 相应 部 分 ,使 微 程 
序 控制 器 的 设计 主要 集中 到 确定 微 指 令 字 的 下 地 址 字段 内 容 。 设 计 完 微 指令 格 式 后 ,就 可 


以 把 全 部 微 指令 安排 到 控制 存储 器 中 ,从 图 6. 13 可 以 看 到 设计 的 结果 。 


描述 实现 4 条 典型 指令 的 ABEL 程序 清单 如 下 。 
MODULE TEC new 
TITIE "controller oponent' 
"a 16 mc 1 new 160913 bak 1.abl 


TECIARATIONS 

FESET, CIK pin 151, 68; 嗓 统 复位 和 时 钟 

IR15..IFO pin 64..57,54..47; "TR 送 来 的 指令 字 

RGIRck pin174,175; "了 接收 控制 低 电 平 有 效 ) 
Cy, Zero pin 169,171; "m2901 产生 的 标志 位 信息 
AB15. .AB0 pin 87..80,77..70; "地 址 总 线 

TB15..B0 Pin 24, 23, 26, 25, 28, 27, 30, 29, 32. .39; 喇 据 总 线 

MO, FEQWE pin 95,94,93 istype 'dc,om'; 喧 制 内 存 和 串口 的 信号 
I8..10 pin 14..21, 135 istype 'dc,om'; "特制 运算 器 的 信号 
B3..B0,R3..M0 pin 9..12，5..8 istype "oam'7 

alucey raml5,ram0,c0 pin 136,137,139,141 istype ‘om'; 

FE CE Z Pin 168,170; "显示 标志 位 

Pc15..pco0,ar15..ar0 npde istype ‘reg, keep'; ' 唯 序 计 数 器 .地址 寄存 器 
mpc15..npc0 node istype 'reg,kesp'; 咖 存 中 断 断 点 的 寄存 器 

flag c,flag z node istype 'reg, keep'; "号 志 位 触发 器 

R_,B ,jr5,rBo nd istype 'cmm'; 中间 信号 .允许 McH 送 信息 到 到 
suml5. .sum), jr zu node istype ‘om'; 哮 用 加 法 器 电路 ,相对 转移 指令 组 


wkl5..wk0,cyl15..cyYL node istype ‘om'; "加 法 器 一 路 输入 、 每 位 进位 输出 
flg c2..flg c0, pe cl, pe _c0,pc ce "flag 和 pc 的 接收 控制 

ar_cey ar BB node istype 'om'; "ar 的 接收 控制 ,ar 的 输出 送 到 
了 连接 am2910 芯 片 的 act Io 管 脚 和 微 程序 控制 器 组 成 --------------- 
CT3..CT0，CC,CCEN pin 106..103, 100, 102; "am2ol10 的 4 位 命令 码 ,转移 控制 


YY5..YYO Pin 124, 125, 122, 123, 120, 121; "zm2910 送 来 的 微 指令 地 址 

DD7..DD0 Pin 118,115,116,113,114,111,112,109 ;  " 粥 下 条 微 指 令 地 址 信息 到 zm2910 
_MP, EL pin 98,96; "zm2910 送 来 的 2 个 控制 信号 

m ir33.m ir0 node istype 'reg, Kesp'; 品 指 令 寄 存 器 

yy5.. yy node istype 'reg, kesp'; "前 微 指令 地 址 

sig33 .. sig0 node istype ‘om'; "特制 存储 器 

madr5.. madr0 node istype ‘om'; " 呐 射 卫 cp 为 微 指 令 首 地 址 

con3. .con0 pode istype "com'7 


站 


"说 明 常 量 和 集合 


flg c= [flg c2..flg c0]; pc oc pc clpc c0]; "Flag、 EC 的 接收 使 能 信号 


mir 四 ir33. .m ir0] ;yy [yy5.-y_ yO]; 


poe= [pc15. .po0] ;IR= [IR15. .IRO]; ar [ar15..ar0]， 


DB- [TB15. .080] ;AB= [AB15. .AB0]; mpo= [mpc15..npc0];su [suml5..sum0]， 


ir cpr [IR15..IR8]; 


"4 条 指令 的 操作 码 和 汇编 语句 名 


全 
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AD=ir op==“h00; AWD=ir cp== “02; 
MPD=ir op==“h88; MER ir op== “h80; 
ERURTIONS 
开 ze (y=h0f); "用 于 专用 加 法 器 aprER 的 信号 
[we15. .wk1]= jr zug [IR7, IR, IR7, IR7, IR7, IR7, IRY, IRY, IRT..IR1]; 
wkO= jr zugIRO# !jr zu; [con3. .con0]= [0,0,0,0]; 
" jr 守 R#JRNCE!flag c# DECsflag c# JRNZ&!flag z#JRZsflag z; ”转移 条 件 为 真 
" 咯 指 令 的 各 字段 信号 到 Mec8 输 出 引 脚 





[D05. .500]= !_MRPE&[madr5. .madrO]# ! ELE&[m ir33..m ir28]; "1 位 下 地 址 字段 信息 
[CI3. .CI0]= RESET [oon3. .con0]# !RESETE Im ir27..m ir24]; "2910 的 命令 码 
_oc=m ir23; CE 0; 中 指 令 转 移 条 件 
[aluoe,c0，I8..I0, A_,B_, MIO,FEQ,WE]= 四 ir22..m ir7]; 贵 指令 的 微 命令 字段 
!RG (y==h00); IR cl cy "到 的 接收 条 件 和 时 钟 信号 
E C= Hag cy F 2 日 ag 2; "显示 标志 位 信息 
[pc ar, flag c, flag z, npc, m ir, yy].clk =CIK; 吓 定 寄存 器 时 钟 信号 
Pc.ce= Pc_ce;Pc_ce= RESET# !RESET& (pc 于 = [0,1])# ec 于 = [1,0]); 
when RESET then {pc:=0;yy:= 0;} else "设置 监控 程序 和 微 程序 的 起 始 地 址 
{fm_ir33. .m ir0]:= [sig33..sig0]; yy:= [YY5..YY0]; 嘻 指 令 寄 存 器 、yy 接 收 
when (pc_o== [0,1]) then pc:= sum; "EC+ 1/offset > FC 


when (pc_o== [1,0]) then pc: " 吸 字 指 令 的 第 2 个 指令 字 一 EC 





flag = (flg == [0,0,1])&Cy # (fg c== [0,1,0])&0 "flag c 接 收 
# (flg co== [1,0,1])& ram0# (flg o== [0,0,0])& flag c; 
flag 2= (flg c== [0,0,1])& Zero # (flg c== [0,1,0])& Zero "flag z 接 收 
# (flg c== [0,0,0])& flag cy 
when ar_ce then ar:=IB; else ar:=ar; "PR 接收 内 存 地 址 
when ar BB then PBB-=ar; else BB-pc; "选择 地 址 总 线 信 息 
when ([A_,B_ ]= = [0,0]) then {[B3..B0]= [IR7..IRA]; [A3..A0]= [IR3..IRO];} 








when ([A_,B_ J]== [0,1]) then {[B3..B0]= [0,1, 0,0]; [A3..20]= [0,1, 0,0];} 
when ([A_,B_]== [1,0]) then {[B3..80]= [0,0, 0,0]; [A3..a0]= [0,0, 0,0];} 
raml5= 0; rer) =0; " 竣 辑 右 移 、 左 移 指令 的 移 位 输入 信号 
Teaml5.ce= !I7; ran0.ce =I17; 路 位 管 脚 输入 输出 的 三 态 控 制 
@ include 'adier pc mc 1.abl' 吴 述 指令 地 址 加 法 器 的 程序 段 
TEUIH TAEIE " 呐 射 了 op 为 微 指令 地 址 --MaPRCM 电 路 


([IR15..IR8] -> [madr5..madr0]) 
[0,0,0,0,0,0,0,0]- > [0,0,0,0,1,1]; [0,0,0,0,0,1,0,1]- > [0,0,1,0,0,0]; "AD RD 
[1,0,0,0,1,0,0,0]-> [0,1,0,0,1,1]; [1,0,0,0,0,0,0,0]-> [0,1,0,0,1,0]; "WED MEA 


嘻 程 序 清单 -- 控 制 存 储 器 电路 
TRUTH_TABIE" ([nadr5. .nadr0,CT3. .CI0, OC,aluoe,c0, I8..I0, A_,B_,MIO,FEQ,WE, 
"lg c2..f1g Ope clipe car ce,ar AB]) 
([YY5. .YY0] - > [sig33. .sig0]) 
[0,0, 0,0,0,0]—> [0,0,0,0,0,1, 0,0,1,1, 0, 1,0, 0,0,1, 0,0,0, 0,0,0, 0,0, 1,0,0, 0,0,0, 0,0, 0,0]; 
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[0,0, 0,0,0,1]-—> [0,0,0,0,1,0, 0,0,1,1, 0, 1,0, 0,0,1, 0,0,0, 0,0,0, 0,0, 0,0,1, 0,0,0, 0,1, 0,0]; 

"MEM(Pc) > IR, FC+ I>EC 
[0,0, 0,0,1,0]—> [0,0,0,0,0,0, 0,0,1,0, 0, 0,0, 0,0,1, 0,0,0, 0,0,0, 0,0, 1,0,0, 0,0,0, 0,0, 0,0]; 

"MP 执行 功能 分 支 
[0,0, 0,0,1,1]—> [0,0,0,0,0,1, 0,0,1,1, 0, 0,0, 0,1,1, 0,0,0, 0,0,1, 0,0, 1,0,0, 0,0,1, 0,0, 0,0]; 

"PD ITR+ SR>IR oz 
[0,0, 0,1,1,1]—> [0,0,0,0,0,1, 0,0,1,1, 0, 0,0, 0,1,1, 1,0,0, 0,0,1, 0,0, 1,0,0, 0,1,0, 0,0, 0,0]; 

"ND IRESRYIR 0z 
[0,1, 0010- > [0,0,0,0,0,1, 0,0,1,1, 0, 1,0, 0,0,1, 0,0,0, 0,0,0, 0,0, 0,0,1, 0,0,0, 1,0, 0,0]; 

"MEA MEM(Pc) > EC 
[ol 0,0,1,1]-> [0,0,0,0,0,0, 0,0,1,1, 0, 1,0, 0,1,1, 000 1,1,1, 0,0, 0,0,1, 0,0,0, 0,1, 0,0]; 

"WFD MM(Pc) YIR, FCti™>EC 

ED 


这 个 程序 是 从 描述 30 条 基本 指令 的 ABEL 程序 中 摘录 出 来 的 ,不 够 完整 ,但 作为 例子 
还 是 合适 的 ,可 以 更 简明 一 些 。 

程序 中 的 说 明 段 的 内 容 , 大 部 分 与 硬 布线 控制 器 中 的 说 明 相 同 , 多 出 了 与 Am2910 芯 
片 相连 接 的 管 脚 说 明 ,多 出 了 微 程序 控制 器 的 专用 电路 ,包括 控制 存储 器 、 微 指令 寄存 器 . 当 
前 微 指令 地 址 ,映射 指令 操作 码 和 微 程 序 段 入 口 地 址 的 电路 等 。 说 明 部 分 给 出 的 是 设计 中 
的 规定 ,可 增 减 但 不 能 轻易 变更 设计 ,例如 器 件 管 脚 号 ,指令 和 微 指令 格式 、 指 令 编码 、 微 指 
令 字段 安排 等 不 能 修改 .变更 造成 的 错误 会 使 系统 不 能 运行 ,还 可 能 损坏 器 件 。 

程序 中 的 逻辑 描述 段 ,以 @include 'adder_pc_mc_1. abl' 的 方式 把 一 段 ABEL 程序 引入 
到 本 程序 中 , 它 实 现 的 功能 是 pc 十 1 或 者 pc 十 offset ( 带 进位 扩展 ) 一 pec, 专用 于 计算 指令 地 
址 ,用 到 的 只 是 线路 设计 知识 ,没有 必要 把 这 段 程序 直接 写 在 本 程序 中 。 

这 个 程序 的 核心 部 分 是 一 些 逻 辑 方程 语句 和 两 个 真 值 表 。 

(1) 逻辑 方程 语句 主要 用 于 描述 触发 器 或 者 寄存 器 电路 的 接收 功能 ,包括 程序 计数 器 
PC 内 存 地 址 寄存 器 AR 保存 ALU 进位 的 触发 器 flag_c、 结 果 为 0 的 触发 器 flag_z, 这 些 时 
序 电 路 可 以 通过 . ce 的 方式 指定 它们 有 接收 使 能 控制 ,例如 pc. ce 一 pc_ce; pc_ce 一 RESET 
# !IRESET&(pc_c 二 二 [0,1])# (pc_c 二 二 [1,0]); 仅 在 pe. ce=1 时 ,pe 才能 够 接收 输入 ， 
否则 pc 内 容 将 保持 不 变 . 哪 些 情况 下 pc 需要 接收 输入 已 经 用 pc_cl 和 pc_c0 两 位 信号 写 在 
对 应 的 微 指令 字 中 。 接 收 的 内 容 采 用 条 件 赋值 语句 另行 给 出 。 其 他 几 个 时 序 电 路 也 是 类 似 
处 理 。 在 硬 布线 控制 器 中 ,我 们 就 没 用 选用 这 种 办 法 .而 是 由 设计 者 自己 来 设计 这 些 使 能 信 
号 的 逻辑 方程 。 

微 指令 寄存 器 m_ir 和 当前 微 指令 地 址 寄存 器 yy 在 每 一 个 时 钟 周期 都 要 执行 接收 操 
作 , 就 不 能 通过 . oe 对 其 说 明 。 

这 里 需要 强调 一 个 重要 概念 ,当前 正在 执行 的 微 指令 的 内 容 是 在 此 前 的 一 个 步骤 从 控 
制 存 储 器 读 出 来 的 sig33 一 sig0, 读 控 存 使 用 的 地 址 是 那 一 时 刻 由 Am2910 提供 的 YY5 一 
YY0 ,需要 在 前 一 步 的 结束 时 刻 把 这 两 部 分 内 容 分 别 接收 到 m_ir 和 yy 寄存 器 ,到 了 本 步 
又 ,才能 够 用 m_ir 的 输出 控制 各 部 件 运行 ,并 用 yy 的 输出 表明 当前 时 刻 并 被 使 用 在 逻辑 方 
程 语句 中 。 当 前 yy 的 内 容 是 前 一 个 步骤 的 YY5~YY0 的 值 ,当前 的 YY5~YY0 的 内 容 是 
读 出 下 一 条 微 指令 的 控 存 地 址 。 
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(2) 真 值 表 主 要 用 于 描述 控制 存储 器 存储 的 信息 , 即 每 一 条 微 指令 的 内 容 。 其 输入 信 
号 是 控 存 的 地 址 信息 YY5~YY0( 由 Am2910 芯片 提供 ) ,输出 信号 是 一 条 微 指令 字 的 具体 
内 容 sig33 一 sig0, 包 括 11 位 的 下 地 址 字段 信息 .7 位 的 时 序 电 路 接收 输入 的 控制 信息 、16 
位 的 微 命令 字段 信息 。 

m_ir 中 的 16 位 微 命令 字段 的 内 容 要 送 到 MACH 芯片 的 输出 管 脚 , 用 于 控制 运算 器 、 
内 存 和 串口 ,具体 实现 的 控制 功能 已 经 在 硬 布线 控制 器 的 章节 讲解 过 了 ,这 里 不 再 袭 述 。 

11 位 的 下 地 址 字段 信息 用 于 确定 下 一 条 微 指 令 的 地 址 ,对 需要 顺序 执行 的 微 指令 ,应 
使 命令 码 CI3 一 CI0 王 1110, 转 移 地 址 每 位 都 填 0 即 可 。 对 需要 转移 的 微 指 令 , 应 使 CI3 一 
CI0=0011 且 -CC=0, 并 在 转移 地 址 字段 直接 给 出 转移 地 址 。 还 可 以 看 到 , 微 指 令 执行 转 
移 的 情况 比较 多 ,顺序 执行 相对 较 少 。 在 本 设计 中 , 微 指 令 的 转移 地 址 几乎 都 为 00001 , 实 
现 的 功能 是 在 指令 结束 后 转 到 下 条 指令 的 取 指 步骤 ,尽量 不 再 使 用 其 他 的 微 指令 转移 方式 ， 
这 会 使 几 条 指令 本 来 可 以 合用 的 一 条 微 指令 字 重 复 几 次 出 现在 微 程序 中 ,好 在 微 指令 总 条 
数 并 不 多 ,多 出 少量 微 指令 不 会 对 系统 产生 影响 。 

7 位 的 时 序 电路 的 输入 接收 控制 信息 用 于 指出 在 哪些 微 指令 的 执行 时 刻 ,哪些 时 序 电 
路 需要 执行 接收 输入 ,接收 的 信息 是 什么 ,这 在 多 个 不 同时 刻 需 要 接收 不 同 的 输入 内 容 的 情 
况 下 ,能够 简化 设计 逻辑 方程 的 工作 ,无须 设计 者 自己 去 设计 寄存 器 的 接收 控制 信号 的 逻辑 
方程 ,又 能 避免 误 把 真 值 表 中 的 YY5~YY0 用 作 当 前 微 指令 的 执行 时 刻 。 我 们 在 微 程 序 清 
单 ( 真 值 表 ) 中 ,特意 增加 了 每 一 条 微 指令 对 应 哪 一 条 指令 的 哪 一 个 执行 步 又、 完成 的 基本 功 
能 是 什么 .标志 位 寄存 器 是 否 需要 变动 等 内 容 。 这 些 信 息 在 微 程序 控制 器 的 设计 过 程 中 是 
有 用 的 ,对 学 生 看 懂 、 理 解 微 程序 控制 器 的 运行 机 制 也 会 有 所 帮助 。 

另外 一 张 真 值 表 用 于 描述 MAPROM 电路 ,实现 的 功能 是 映射 指令 操作 码 为 微 指令 地 
址 ,其 输入 信号 是 8 位 的 指令 操作 码 , 输 出 信号 是 6 位 的 微 指令 地 址 madr。 选 用 了 真 值 表 ， 
设计 者 就 无 须 自己 设计 madr 每 一 位 的 逻辑 方程 ,而 交 由 ABEL 的 编译 软件 完成 。 


本 章 内 容 小 结 和 学 习 方法 建议 


本 章 重 点 讲授 简单 计算 机 控制 器 的 功能 、 组 成 与 实现 ,这 对 于 本 课程 来 说 是 比较 难 学 .但 
又 是 很 重要 的 部 分 。 教 学 安排 以 指令 的 执行 过 程 ( 步 又 ) 为 主线 索 , 把 通用 原理 性 知识 与 真实 
计算 机 控制 器 实例 相 结 合 ,以 硬 布线 方案 的 控制 器 为 主 ,并 简单 介绍 微 程序 控制 器 的 基础 
知识 。 

学 过 本 章 之 后 ,学 生 应 该 重点 掌握 的 内 容 是 控制 器 的 功能 与 组 成 和 运行 控制 。 硬 布线 
控制 器 的 功能 是 按照 指令 及 其 所 处 的 执行 步骤 向 计算 机 各 个 功能 部 件 提供 它们 协调 运行 所 
需要 的 控制 信号 ,在 计算 机 硬件 系统 中 发 挥 指挥 控制 的 作用 。 甚 基本 组 成 包括 程序 计数 器 
PC( 提 供 指令 地 址 ) .指令 寄存 器 IR( 保 存 指令 内 容 ) .节拍 发 生 器 Timing( 指 出 指令 的 执行 
步骤 ) .控制 信号 产生 部 件 CU( 用 于 向 计算 机 各 部 件 提供 每 条 指令 、 每 个 执行 步 又 的 控制 信 
号 ) 这 4 个 部 分 。 对 微 程序 控制 器 ,更 希望 通过 对 比 它 和 硬 布线 控制 器 在 功能 、 组 成 .所 用 电 
路 .运行 速度 .适用 场合 等 几 个 方面 的 相同 与 差异 之 处 的 方式 来 学 习 。 

从 指令 执行 步骤 区 分 3 种 方案 。 有 单 指令 周期 的 方案 ,所 有 指令 都 安排 在 同一 个 时 钟 周 
期 完成 ,造成 资源 利用 率 和 系统 运行 效率 都 低 . 实 用 性 差 ; 多 指令 周期 的 方案 ,不 同 指令 选用 不 
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同 的 执行 步 又 完成 ,资源 利用 率 和 系统 运行 效率 居中 , 曾 得 到 广泛 应 用 ,目前 使 用 较 少 ,但 作为 
计算 机 组 成 原理 这 门 课程 , 仍 属于 重点 教学 内 容 , 也 是 学 习 指 令 流 水 线 方案 的 基础 ;指令 流水 
线 的 方案 ,资源 利用 率 和 系统 运行 效率 最 高 ,目前 被 普遍 应 用 ,多 数 人 更 倾向 于 把 它 划 归 到 计 
算 机 系统 结构 课程 的 教学 范围 之 内 ,在 本 教材 中 把 这 部 分 内 容 单独 安排 到 第 13 章 中 进行 讲 
解 。 后 两 种 方案 中 ,每 条 指令 都 是 经 过 读 取 指 令 .指令 译 码 和 指令 执行 (可 能 又 细 分 为 几 个 具 
体 步 又 ) 这 几 个 步 又 完成 的 ,指令 的 执行 步骤 是 明确 表现 出 来 的 ,而 在 单 指令 周期 方案 中 ,每 条 
指令 的 执行 过 程 同样 要 按照 读 取 指 令 、 指 令 译 码 和 指令 执行 的 时 间 序 列 依次 启动 并 开始 有 效 
运行 ,只 是 开始 后 就 要 一 直 持 续 下 去 直到 读 出 下 一 条 指令 ,而 不 是 分 阶段 依次 完成 。 

学 习 控 制 器 ,需要 通过 具体 的 实际 例子 ( 某 种 特定 情况 ) 来 加 深 理解 , 既 不 能 只 是 很 抽象 
空 泛 地 知晓 某 些 原理 知识 ,又 不 能 被 特例 的 某 些 实现 细节 所 迷惑 ,处 理 好 二 者 的 关系 十 分 重 
要 。 在 教材 中 给 出 一 个 加 了 详细 注释 的 、 描 述 简单 CPU 系统 的 组 成 和 功能 的 ABEL-HDL 
语言 的 源 程序 ,并 能 够 在 配套 的 教学 实验 设备 上 调试 运行 ,查看 运行 结果 ,在 此 基础 上 又 可 
以 对 其 加 以 修改 和 完善 ,开展 学 生 自己 的 设计 与 实现 工作 ,成 为 一 个 非常 好 的 教学 过 程 和 实 
践 环境 。 我 们 希望 让 学 生 真实 感受 到 看 懂 这 个 程序 确实 不 是 太 困 难 的 事情 ,开展 自己 的 设 
计 与 实现 工作 也 是 办 得 到 的 。 如 果 教 材 中 不 提供 一 个 可 行 、 简 单 的 CPU"* 蓝 本 ”, 讲 完 基本 
原理 就 要 求学 生 开展 设计 实现 工作 ,其 难度 就 太 大 了 一 些 。 若 能 够 用 VHDL 语言 设计 一 个 
简单 的 CPU ,又 能 围绕 FPGA 芯片 实现 一 个 基本 的 整 机 系统 是 非常 理想 的 学 习 过 程 ,可 以 
取得 非常 好 的 教学 效果 ,但 难度 要 更 大 一 些 ,在 与 本 教材 配套 的 实验 教程 中 给 出 了 一 个 称 之 
为 FPGA-CPU 的 例子 ,有 兴趣 与 有 精力 的 同学 不 妨 看 看 此 程序 。 





习题 与 思考 题 
1. 控制 器 的 功能 是 5 
A. 向 计算 机 各 部 件 提供 控制 信号 B. 执行 语言 翻译 
C. 支持 汇编 程序 D. 完成 数据 运算 
2. 从 资源 利用 率 和 性 能 价格 比 考虑 ,指令 流水 线 方案 ,多 指令 周期 方案 
, 单 指令 周期 方案 
A. 最 好 B. 次 之 C. 最 不 可 取 D. 都 差不多 
3. RISC 比 CISC 使 用 的 指令 条 数 ,只 用 硬件 实现 那些 功能 的 指令 ， 
指令 每 个 执行 步骤 用 时 __。 
A. 更 多 B. 更 少 C. 更 简单 D. 更 强大 
E. 更 长 F. 更 短 G. 相当 接近 


4. 指出 下 面 各 题 的 对 错 . 并 简单 说 明理 由 。 

(1) 程序 计数 器 PC 主要 用 于 解决 指令 的 执行 次 序 。 

(2) 程序 计数 器 PC 可 以 提供 数据 在 内 存储 器 中 的 地 址 。 

(3) 指令 寄存 器 用 于 保存 指令 内 容 。 

(4) 指令 寄存 器 用 于 保存 指令 地 址 。 

(5) 微 程序 控制 器 的 运行 速度 一 般 要 比 硬 布线 控制 器 更 快 。 

(6) RISC 结构 的 计算 机 在 同等 性 能 的 情况 下 处 理 器 芯片 的 设计 和 制作 成 本 更 低 。 
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(7) 在 微 程序 控制 器 中 不 设置 微 指 令 寄存 器 也 是 可 行 的 。 

5. 简 述 计算 机 的 控制 器 的 功能 和 基本 组 成 。 微 程序 的 控制 器 和 硬 布线 的 控制 器 在 组 
成 和 运行 原理 方面 的 相同 .不同 之 处 表现 在 哪些 方面 ? 

6. 在 硬 布线 控制 器 中 ,节拍 发 生 器 的 功能 是 什么 ? 节拍 发 生 器 属于 什么 类 型 的 数字 
电路 ? 

7. 硬 布线 控制 器 的 时 序 控制 信号 产生 部 件 是 用 什么 类 型 的 数字 电路 实现 的 ?该 部 件 
的 输入 信号 可 能 包括 哪 一 些 ? 

8. 控制 器 的 设计 和 该 计算 机 的 指令 系统 是 什么 关系 ? 

9. 微 指令 的 下 一 条 微 指令 地 址 通常 有 哪些 来 源 ? 从 微 程序 设计 的 角度 ,指出 可 能 需要 
支持 哪些 微 程序 执行 的 流程 结构 ? 为 此 又 应 有 什么 样 的 硬件 线路 支持 ? 

10. 在 微 程序 的 控制 器 的 组 成 中 ,为 什么 通常 总 要 设置 微 指 令 寄存 器 部 件 呢 ? 

11. 指令 采用 顺序 方式 .流水线 方式 执行 的 主要 差别 是 什么 ”各 有 什么 优点 和 缺点 ? 

12. 在 指令 流水 线 中 ,每 一 条 指令 本 身 的 执行 时 间 减 少 了 吗 ? 如 果 没 减少 ,那么 为 什么 
还 要 采用 流水 线 技术 呢 ? 一 般 来 说 流水 线 有 哪些 特点 ? 总 结 流水 线 各 种 分 类 方法 的 原则 。 

13. 假设 一 条 指令 的 执行 过 程 分 为 * 取 指令 ”“ 分 析 ” 和 "执行 "3 段 ,每 段 的 时 间 分 别 是 
At、2At 和 3At。 在 下 列 各 种 情况 下 ,分 别 写 出 连续 执行 n 条 指令 所 需要 的 时 间 表 达 式 。 

(1) 顺序 执行 。 

(2) 仅 * 取 指令 ”和 "执行 " 重 县 。 

(3)“ 取 指令 ”“ 分 析 ” 和 "执行 " 重 关 。 

14. 什么 是 流水 线 的 相关 问题 ?通常 都 有 哪 几 类 相关 问题 ?这 些 相关 问题 都 是 什么 原 
因 造 成 的 ? 各 种 相关 问题 都 有 哪些 解决 方法 ? 

15. 汉 。 诺 依 曼 计算 机 中 指令 和 数据 均 以 二 进 制 形式 存放 在 存储 器 中 ,CPU 区 别 它 们 
的 依据 是 网 
A. 指令 操作 码 的 译 码 结果 B. 指令 和 数据 的 寻 址 方式 

C. 指令 周期 的 不 同 阶 段 D. 指令 和 数据 所 在 的 存储 单元 
16. 相对 于 微 程序 控制 器 , 硬 布线 控制 器 的 特点 是 。 

A. 指令 执行 速度 慢 , 指 令 功 能 的 修改 和 扩展 容易 

B. 指令 执行 速度 慢 , 指 令 功能 的 修改 和 扩展 难 

C. 指令 执行 速度 快 ,指令 功能 的 修改 和 扩展 容易 

D. 指令 执行 速度 快 ,指令 功能 的 修改 和 扩展 难 
17. 下 列 选项 中 ,能 缩短 程序 执行 时 间 的 措施 是 。 
I. 提高 CPU 时 钟 频率 于. 优化 数据 通路 结构 “由 . 对 程序 进行 编译 优化 








A. 仅 I 和 B. 仅 工 和 本 C. 仅 全 和 J D. 工 、 呈 和 本 
18. 下 列 寄存 器 中 ,汇编 语言 程序 员 可 见 的 是 

A. 存储 器 地 址 寄存 器 (MAR) B. 程序 计数 器 (PC) 

C. 存储 器 数据 寄存 器 (MDR) D. 指令 寄存 器 (IR) 


19. 假定 不 采用 Cache 和 指令 预 取 技术 , 且 机 器 处 于 “ 开 中 断 ” 状 态 , 则 在 下 列 有 关 指令 
执行 的 叙述 中 ,错误 的 是 。 
A. 每 个 指令 周期 中 CPU 都 至 少 访问 内 存 一 次 
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B. 每 个 指令 周期 一 定 大 于 或 等 于 一 个 CPU 周期 

C. 空 操作 指令 的 指令 周期 中 任何 寄存 器 的 内 容 都 不 会 被 改变 

D. 当前 程序 在 每 条 指令 执行 结束 时 都 可 能 被 外 部 中 断 打 断 

20. 某 计算 机 字 长 16 位 ,采用 16 位 定 长 指令 字 结 构 , 部 分 数据 通路 结构 如 图 6. 14 所 

示 。 图 中 所 有 控制 信号 为 1 时 表示 有 效 , 为 0 时 表示 无 效 。 例 如 控制 信号 MDRinE 为 1 表 
示人 允许 数据 从 DB 打 和 人 MDR ,MDRin 为 1 表示 允许 数据 从 内 总 线 打 和 人 MDR。 假 设 MAR 
的 输出 一 直 处 于 使 能 状态 。 加 法 指令 “ADD (R1,R0)” 的 功能 为 (RO0) 十 ((R1)) 一 (R1), 即 
将 RO 中 的 数据 与 R1 的 内 容 所 指 主 存单 元 的 数据 相 加 ,并 将 结果 送 入 R1 的 内 容 所 指 主 存 


单元 中 保存 。 
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图 6.14 16 位 字 长 指令 结构 


表 6.4 给 出 了 上 述 指令 取 指 和 译 码 阶段 每 个 节拍 (时 钟 周期 ) 的 功能 和 有 效 控制 信号 ， 
请 按 表 中 描述 方式 用 表格 列 出 指令 执行 阶段 每 个 节拍 的 功能 和 有 效 控制 信号 。 


表 6.4 指令 取 指 和 译 码 阶段 每 个 节拍 的 功能 和 有 效 控制 信号 

















时 钟 功能 有 效 控制 信号 
Cl MAR<-(PC) PCout. MARin 
C2 MDR<—M(MAR) MemR. MDRinE 

了 PC<-(PC) 十 1 PC 十 1 
C3 IR<—(MDR) MDRout,IRin 
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时 钟 功能 有 效 控制 信号 











C4 指令 译 码 无 


21. 某 计算 机 字 长 为 16 位 , 主 存 地 址 空间 大 小 为 128KB, 按 字 编 址 ,采用 单字 长 指令 格 
式 , 指 令 各 字段 定义 如 图 6. 15 所 示 。 


| i | | | 0 


OP ll M !| Ro 
源 操作 数 目的 操作 数 


图 6.15 16 位 字 长 计算 机 的 指令 格式 




















转移 指令 采用 相对 寻 址 方式 ,相对 偏 移 是 用 补 码 表示 的 。 寻 址 方式 定义 如 表 6. 5 所 示 。 
表 6.5 相对 寻 址 方式 























M,/Ma 寻 址 方式 助 记 符 滞 多 
000B 寄存 器 直接 R, 操作 数 二 (Rn) 
001B 寄存 器 间接 (R,) 操作 数 一 ((R,)) 
010B 寄存 器 间接 、 自 增 (CR。) 十 操作 数 二 ((R,)),(R,) 十 1 一 R， 
011B 相对 DCR,) 转移 目标 地 址 一 (PC) 十 (R,) 
说 明 : (x) 表 示 存 储 器 地 址 x 或 寄存 器 x 的 内 容 。 
请 回答 下 列 问题 : 


(1) 该 指令 系统 最 多 可 有 多 少 条 指令 ? 该 计算 机 最 多 有 多 少 个 通用 寄存 器 ? 存储 器 地 
址 寄存 器 (MAR) 和 存储 器 数据 寄存 器 (MDR) 至 少 各 需 多 少 位 ? 

(2) 转移 指令 的 目标 地 址 范围 是 多 少 ? 

(3) 若 操作 码 0010B 表示 加 法 操作 ( 助 记 符 为 add) ,寄存 器 R4 和 R5 的 编号 分 别 为 
100B 和 101B.R4 的 内 容 为 1234H',R5 的 内 容 为 5678H ,地址 1234H 中 的 内 容 为 5678H， 
地 址 5678H 中 的 内 容 为 1234H, 则 汇编 语句 为 "add (R4),(R5) 十 ”( 逗 号 前 为 源 操 作 数 , 豆 
号 后 为 目的 操作 数 ) 对 应 的 机 器 码 是 什么 (用 十 六 进 制 表 示 )? 该 指令 执行 后 ,哪些 寄存 器 和 
存储 单元 的 内 容 会 改变 ?改变 后 的 内 容 是 什么 ? 

22. 某 计 算 机 的 指令 流水 线 由 4 个 功能 段 组 成 ,指令 流 经 各 功能 段 的 时 间 ( 忽 略 各 功能 
段 之 间 的 缓存 时 间 ) 分 别 为 90 ns、80 ns、70 ns 和 60 ns. 则 该 计算 机 的 CPU 时 钟 周期 至 少 
是 





A. 90 ns B. 80 ns C。70 ns D. 60 ns 
23. 下 列 不 会 引起 指令 流水 阻塞 的 是 。 
A. 数据 旁 路 (转发 ) B. 数据 相关 C. 条 件 转 移 D. 资源 冲突 
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多 级 结构 存储 器 系统 和 主 存储 器 


主 存储 器 ,又 称 内 存储 器 ,是 传统 计算 机 硬件 系统 的 5 大 功能 部 件 之 一 ,用 于 存储 处 在 
运行 中 的 程序 和 相关 数据 ,其 容量 与 读 写 速度 等 指标 对 计算 机 总 体 性 能 有 重大 影响 。 因 此 ， 
在 现代 的 计算 机 系统 中 ,通常 采用 由 3 种 运行 原理 不 同 、 性 能 差异 很 大 的 存储 介质 分 别 构建 
高 速 缓冲 存储 器 . 主 存 储 器 和 虚拟 存储 器 ,再 将 它们 组 成 3 级 结构 的 统一 管理 调度 的 一 体 化 
存储 器 系统 。 由 高 速 缓冲 存储 器 缓解 主 存 读 写 速度 慢 ,不 能 满足 CPU 运行 速度 需要 的 了 矛 
盾 ; 用 虚拟 存储 器 (快速 磁盘 上 的 一 片 存储 区 ) 更 大 的 存储 空间 解决 主 存 容量 小 , 存 不 下 更 大 
程序 与 更 多 数据 的 难题 。 显 而 易 见 ,3 级 结构 的 存储 器 系统 ,是 围绕 主 存储 器 来 组 织 和 运行 
的 。 就 是 说 ,设计 与 运行 程序 是 针对 主 存储 器 进行 的 ,充分 表明 主 存储 器 在 计算 机 系统 中 举 
足 轻 重 的 地 位 。 

本 章 首 先 介 绍 多 级 结构 存储 器 系统 的 基本 组 成 ,各 级 存储 器 所 用 介质 的 特性 ,多 级 结构 
存储 器 结构 应 满足 的 原则 ,以 及 它 得 以 高 效 运行 的 原理 ; 接 下 来 讲解 主 存储 器 的 设计 和 实用 
技术 ,包括 动态 存储 器 芯片 和 动态 存储 器 芯片 对 一 个 二 进 制 位 信息 的 存储 、 读 写 的 基本 原 
理 , 组 成 存储 器 系统 涉及 的 相关 技术 ,提高 主 存 器 性 能 的 思路 和 解决 方案 。 


7.1 存储 器 系统 概述 


与 汉 。 诺 依 曼 计算 机 以 运算 器 为 中 心 不 同 ,现代 计算 机 系统 以 存储 器 为 中 心 。 在 程序 
执行 的 过 程 中 ,CPU 调 入 的 指令 、 运 算 器 需要 的 数据 以 及 需要 存 回 的 运算 结果 ,都 要 对 存储 
器 进行 操作 ;各 种 输入 输出 设备 通常 也 直接 与 存储 器 交换 数据 ;多 处 理 器 系统 中 ,各 处 理 器 
共享 的 数据 通过 共享 存储 器 实现 。 因 此 ,存储 器 是 各 种 信息 存储 和 交换 的 中 心 。 

存储 器 存储 一 位 (bit) 二 进 制 代 码 的 存储 元 件 称 为 基本 存储 单元 。 存 储 器 中 ,作为 一 个 
整体 存 取 的 二 进 制 数组 成 一 个 存储 字 ,存储 字 的 位 数 被 称 为 存储 器 的 字 长 。 存 放 一 个 存储 
字 的 空间 称 为 存储 单元 , 按 一 定 规则 组 合 在 一 起 的 大 量 存储 单元 构成 一 个 存储 体 。 

对 于 存储 系统 ,存储 器 与 外 界 一 次 传送 的 二 进 制 位 数 称 为 粒度 。 依 据 计算 机 计算 的 需 
要 ,不 同 的 存储 器 或 同一 存储 器 在 不 同 场合 .与 外 界 传送 的 粒度 是 不 同 的 ,通常 有 字 节 、 字 、 


7.1.1 存储 器 分 类 
随 着 计算 机 系统 结构 的 发 展 和 微 电 子 技术 的 进步 ,存储 器 的 种 类 也 越 来 越 多 ,可 以 按照 
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多 种 方法 对 其 进行 分 类 ,如 按 存储 介质 、 按 存 取 方 式 或 按 它 们 在 计算 机 中 的 作用 来 划分 。 

1. 按 存储 介质 划分 

现代 计算 机 中 的 程序 和 数据 都 是 用 二 进 制 数 表示 的 ,因此 ,从 理论 上 讲 , 只 要 有 两 个 明 
显 稳定 的 物理 状态 且 状 态 间 能 比较 容易 地 进行 转换 的 介质 ,都 可 以 用 作 计 算 机 的 存储 器 。 
当然 ,它们 还 必须 满足 一 些 其 他 要 求 . 如 读 写 的 可 靠 性 和 速度 等 。 

根据 存储 介质 的 不 同 , 存 储 器 可 以 划分 为 磁 芯 存储 器 .半导体 存储 器 .光电 存储 器 、 磁 表 
面 存储 器 和 光盘 存储 器 等 。 当 前 ,计算 机 的 主 存 使 用 的 大 多 是 半导体 存储 器 ,外 存 一 般 为 磁 
表面 存储 器 和 光盘 存储 器 。 

2. 按 存 取 方 式 划分 

按照 不 同 的 存 取 方式 ,存储 器 可 以 划分 成 随机 访问 存储 器 (Random Access Memory， 
RAM) ,只 读 存 储 器 (Read Only Memory,ROM) 和 顺序 访问 存储 器 (Serial Access Storage， 
SAS) 。 

从 字面 上 讲 , 随 机 访问 存储 器 RAM 指 的 是 可 以 通过 指令 随机 地 ,个 别 地 对 各 存储 单元 
进行 读 写 访问 的 存储 器 。 一 般 情况 下 ,访问 所 需 的 时 间 基 本 固定 ,与 存储 单元 的 地 址 无 关 。 
目前 几乎 所 有 的 计算 机 中 ,RAM 都 是 主 存储 器 的 主要 组 成 部 分 ,一 旦 断 电 后 ,RAM 芯片 内 
的 已 有 内 容 会 全 部 丢失 。 

只 读 存储 器 ROM 的 性 质 和 RAM 基本 相同 ,只 是 其 内 容 一 经 写 入 后 , 仅 供 读 取 使 用 ， 
正常 使 用 的 情况 下 无 法 对 其 进行 再 次 写 入 。 但 是 断 电 后 依然 能 保存 已 有 信息 , 它 常用 来 存 
放 计 算 机 的 引导 程序 、 各 种 字符 及 符号 的 字 型 库 等 内 容 。 它 和 RAM 共享 计算 机 主 存储 器 
的 地 址 空间 ,所 以 也 是 主 存储 器 的 组 成 部 分 。 

ROM 并 非 绝 对 不 可 以 写 人 . 随 着 半导体 技术 的 发 展 ,出 现 了 可 编程 只 读 存储 器 
(Programmable ROM., PROM)、 可 擦 除 的 可 编程 只 读 存储 器 (Erosible Programmable 
ROM,EPROM) 和 其 他 许多 不 同 种 类 的 ROM 。 

3. 按 功能 效用 划分 

按照 存储 器 在 计算 机 系统 中 作用 的 不 同 , 可 将 它们 划分 为 主 存储 器 (内 存 )、 辅 助 存储 器 
(也 包括 外 存 ) 和 高 速 缓冲 存储 器 等 。 主 存 一 般 由 半导体 存储 器 来 承担 ,其 特点 是 存 取 速度 
快 , 但 容量 较 小 .每 位 价格 也 比较 高 。 外 存 主要 是 磁 表 面 存储 器 和 光盘 存储 器 ,如 磁盘 、 磁 带 
和 光盘 ,它们 容量 大 、 每 位 价格 低 , 但 速度 慢 。 高 速 缓冲 存储 器 速度 最 高 ,但 每 位 的 价格 也 最 
昂贵 ,一 般 用 在 CPU 和 主 存 之 间 , 用 来 缓存 信息 。 


7.1.2 存储 器 系统 目标 


随 着 计算 机 系统 的 不 断 发 展 和 进步 ,人 们 对 计算 机 存储 器 的 要 求 也 越 来 越 高 ,主要 体现 
在 以 下 几 个 方面 。 

1. 存储 速度 

微 电 子 技术 的 进步 带动 计算 机 芯片 的 集成 度 每 年 都 快速 提高 ,使 计算 机 行业 以 其 他 行 
业 无 法 比拟 的 速度 突飞猛进 。 每 片 蕊 片 中 集成 的 晶体 管 越 多 , 即 蕊 片 中 的 逻辑 门 数 量 越 多 ， 
也 就 意味 着 具有 更 大 的 主 存 和 更 强 的 处 理 能 力 。 

虽然 都 以 差不多 的 速度 发 展 ,但 CPU 和 主 存 的 发 展 方向 却 不 一 样 。CPU 着 力 提 高 的 
是 其 处 理 速度 ,而 主 存 的 发 展 却 是 以 提高 容量 为 主 ,兼顾 访问 速度 的 提高 。 不 同 的 发 展 策略 
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使 CPU 和 主 存 的 速度 差距 越 来 越 大 。 图 7.1 给 出 了 CPU 和 动态 存储 器 DRAM 的 性 能 
比较 。 


一 处 理 器 性 能 
1000| 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 CpU 生 年 增长 60% 







CPU 与 主 存储 器 的 性 能 
差异 ， 每 年 增长 50% 
2 一 一 动态 存储 器 性 能 
Co DRAM 每 年 增长 9% 





图 7.1 CPU 与 DRAM 性 能 比较 


主 存 速度 如 果 跟 不 上 CPU 速度 的 话 ,CPU 也 就 无 法 发 挥 出 其 高 性 能 。 如 何 弥补 CPU 
和 动态 存储 器 在 性 能 上 的 差距 ,是 存储 器 系统 要 解决 的 问题 之 一 。 

2. 存储 容量 

存储 器 在 容量 上 的 进步 速度 可 以 用 Moore 定律 来 说 明 , 它 是 由 Intel 公司 的 董事 长 和 
创建 者 之 一 一 一 Gordon Moore 在 1965 年 发 现 并 以 他 的 名 字 命 名 的 。 在 为 一 个 工业 组 织 准 
备 讲稿 时 ,Moore 注意 到 新 一 代 主 存 芯 片 都 是 在 它 的 上 一 代 推 出 3 年 后 出 现 的 ,而 且 都 是 上 
一 代 容 量 的 4 倍 。Moore 据 此 认识 到 每 片 芯 片 中 集成 的 晶体 管 数 量 是 以 基本 固定 的 速度 增 
加 的 ,而 且 预 测 今后 10 年 也 会 保持 这 个 发 展 速度 。 现 在 ,Moore 定律 的 通常 表述 是 每 个 芯 
片 中 的 晶体 管 数量 18 个 月 翻 一 番 ,也 就 是 说 ,每 年 增长 60%。 

当然 ,Moore 定律 实际 上 并 不 是 一 条 定律 , 它 只 是 根据 对 固体 物理 学 家 和 工艺 工程 
师 推 动 芯片 发 展 工作 的 观察 而 得 出 的 经 验 公 式 , 并 预测 将 来 还 会 保持 这 个 发 展 速度 。 
许多 工业 观察 家 预计 Moore 定律 在 21 世纪 还 会 有 效 , 也 许 到 2020 年 。 到 那 时 ,晶体 
管 将 小 得 无 法 让 人 相信 ,而 且 随 着 量子 力学 的 发 展 ,用 单个 电子 的 旋转 来 存储 一 位 将 
成 为 可 能 。 

然而 ,存储 器 在 容量 上 的 飞速 发 展 依然 很 难 满足 软件 对 存储 器 的 要 求 。 微 软 高 级 经 理 
Nathan Myhrvold 提出 了 Nathan 的 软件 第 一 定律 。 他 认为 : “软件 是 一 种 可 以 膨胀 到 充满 
整个 容器 的 气体 .”20 世纪 80 年 代 流 行 的 字 处 理 软 件 是 类 似 于 Troff 之 类 的 程序 ,占用 几 十 
KB 主 存 , 而 现在 的 字 处 理 软件 要 占用 几 十 MB 主 存 ,将 来 毫 无 疑问 要 占用 几 十 GB。 软件 
的 这 个 特点 对 更 快 的 处 理 器 .更 大 的 主 存 .更 强 的 输入 /输出 能 力 提 出 了 持续 的 要 求 。 如 何 
满足 这 些 要 求 成 为 存储 器 系统 面 对 的 又 一 个 问题 。 

3. 单位 价格 

存储 器 容量 的 高 速 膨胀 带 来 的 问题 是 大 家 对 其 单位 成 本 越 来 越 高 的 关注 。 如 果 不 考虑 
价格 因素 ,也 许 就 用 不 着 辅助 存储 器 了 。 速 度 和 容量 的 增加 如 何 控制 在 用 户 能 够 承受 的 合 
理 价格 之 内 ,是 存储 器 系统 面临 的 第 3 个 问题 。 

总 之 ,存储 器 系统 的 设计 需要 在 速度 、 容 量 和 价格 (/ 位 )3 个 方面 综合 考虑 ,在 合理 的 价 
格 上 提供 尽 可 能 高 的 访问 速度 和 尽 可 能 大 的 存储 容量 。 
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7.1.3 多 级 结构 存储 器 系统 


在 现代 计算 机 系统 中 ,广泛 采用 由 3 种 运行 原理 不 同 、 性 能 差异 很 大 的 存储 介质 ,来 分 
别 构建 高 速 缓冲 存储 器 . 主 存储 器 和 虚拟 存储 器 ,再 将 它们 组 成 通过 计算 机 硬 软件 统一 管理 
与 调度 的 三 级 结构 的 存储 器 系统 ,如 图 7.2 所 示 。 





CPU 





虚拟 存储 器 


高 速 缓存 |- 二 -| 主 存储 加 全 


图 7.2 3 级 结构 的 存储 器 系统 



































这 种 3 级 结构 的 存储 器 系统 ,是 围绕 读 写 速度 尚 可 ,存储 容量 适中 的 主 存储 器 来 组 织 和 
运行 的 ,并 由 高 速 缓冲 存储 器 缓解 主 存 读 写 速度 慢 , 不 能 满足 CPU 运行 速度 需要 的 矛盾 ; 
用 虚拟 存储 器 更 大 的 存储 空间 解决 主 存 容量 小 、 存 不 下 规模 更 大 的 程序 与 更 多 数据 的 难题 ， 
从 而 达到 使 整个 存储 器 系统 有 更 高 的 读 写 速度 、 尽 可 能 大 的 存储 容量 、 相 对 较 低 的 制造 与 运 
行 成 本 。 高 速 缓冲 存储 器 的 问题 是 容量 很 小 ,虚拟 存储 器 的 问题 是 读 写 速 太 慢 。 追 求 整个 
存储 器 系统 有 更 高 的 性 能 /价格 比 的 核心 思路 ,在 于 使 用 中 充分 发 挥 3 级 存储 器 各 自 的 优 
势 , 尽 量 避 开 其 短处 。 很 显然 ,存储 相同 数量 的 信息 ,使 用 读 写 速度 快 的 存储 介质 时 ,其 价格 
通常 总 是 要 高 一 些 。 

这 种 3 级 结构 的 存储 器 系统 的 运行 原理 ,或 者 说 它 可 以 有 良好 的 性 能 /价格 比 , 是 建立 
在 程序 运行 的 局 部 性 原理 之 上 的 。 程 序 运行 的 局 部 性 原理 主要 体现 在 如 下 3 个 方面 。 

(1) 时 间 方 面 。 在 一 小 段 时 间 内 ,最 近 被 访问 过 的 程序 和 数据 很 可 能 再 次 被 访问 。 

(2) 空间 方面 。 这 些 最 近 被 访问 过 的 程序 和 数据 ,往往 集中 在 一 小 片 存储 区 域 中 。 

(3) 指令 执行 顺序 方面 。 指 令 顺序 执行 比 转移 执行 的 可 能 性 要 大 (大 约 为 5 : 1)。 

这 样 就 有 可 能 把 要 使 用 的 程序 和 数据 , 按 其 使 用 的 急迫 和 频繁 程度 ,分 时 间 段 分 批量 、 
合理 地 调和 人 存储 容量 不 同 、 读 写 速度 不 同 的 存储 器 部 件 中 ,并 由 计算 机 硬件 .软件 自动 地 统 
一 管理 与 调度 。 就 是 说 ,把 CPU 最 近 一 小 段 时 间 要 频繁 .高速 使 用 的 信息 存储 在 高 速 缓冲 
存储 器 中 ,可 以 快速 完成 读 写 操作 ,不 至 于 拖 慢 CPU 的 运行 速度 ,问题 是 信息 数量 不 能 太 
多 ,但 在 这 一 小 段 时 间 内 也 算 够 用 了 ;把 在 略 长 一 段 时 间 内 要 用 的 较 多 信息 存放 在 主 存储 器 
中 ,只 是 在 CPU 从 高 速 缓冲 存储 器 中 找 不 到 要 用 的 信息 时 , 才 读 速度 较 慢 的 主 存储 器 ,用 
时 会 长 些 ,但 找到 这 一 信息 的 概率 会 大 得 多 ,在 把 得 到 的 信息 读 和 人 CPU 的 同时 ,还 顺便 将 
其 写 人 到 高 速 缓冲 存储 器 中 ,并 标明 这 一 信息 来 自主 存储 器 的 哪个 存储 单元 ,下 次 再 用 到 这 
一 信息 时 ,就 不 必 再 去 读 速度 较 慢 的 主 存 储 器 ,而 是 快速 地 从 高 速 缓冲 存储 器 中 直接 得 到 ， 
把 那些 暂时 可 以 先 不 使 用 的 信息 保存 在 容量 非常 大 的 虚拟 存储 器 中 ,用 到 时 再 从 那里 以 更 
大 的 批量 读 入 主 存储 器 . 读 入 的 速度 会 慢 得 多 ,但 确保 再 大 的 程序 和 再 多 数据 总 有 办 法 (分 
时 ,分 批量 地 ) 调 入 主 存 储 器 且 保 证 其 正常 运行 。 

在 3 级 结构 的 存储 器 系统 中 ,这 3 级 不 同 的 存储 器 中 存放 的 信息 必须 满足 如 下 两 个 








地 人 汽 


计算 机 组 成 与 体系 结构 (第 3 版 ) 





原则 。 

(1) 一 致 性 原则 。 同 一 个 信息 会 同时 存放 在 几 个 级 别 的 存储 器 中 ,此 时 ,这 一 信息 在 几 
个 级 别 的 存储 器 中 必须 保持 相同 的 值 。 

(2) 包含 性 原则 。 处 在 内 层 (更 靠近 CPU) 存 储 器 中 的 信息 一 定 被 包含 在 各 外 层 的 存 
储 器 中 , 即 内 层 (更 靠近 CPU) 存 储 器 中 的 全 部 信息 一 定 是 各 外 层 存储 器 中 所 存 信息 中 一 小 
部 分 的 副本 ,这 是 保证 程序 正常 运行 实现 信息 共享 .提高 系统 资源 利用 率 所 必须 的 ,反之 则 
不 成 立 。 例 如 ,高 速 缓冲 存储 器 中 的 信息 ,肯定 也 存放 在 主 存储 器 中 ,还 存放 在 虚拟 存储 器 
中 ,但 主 存储 器 中 的 非常 多 的 信息 不 会 同时 在 高 速 缓 冲 存储 器 中 ,虚拟 存储 器 中 的 更 多 的 信 
息 也 不 会 同时 出 现在 主 存储 器 中 。 

3 级 不 同 的 存储 器 是 用 读 写 速度 不 同 、 存 储 容量 不 同 、 运 行 原理 不 同 、 管 理 使 用 办 法 也 
不 尽 相 同 的 不 同 存储 介质 实现 的 。 高 速 缓冲 存储 器 使 用 静态 存储 器 芯片 实现 , 主 存储 器 通 
常 使 用 动态 存储 器 芯片 实现 ,而 虚拟 存储 器 则 使 用 快速 磁盘 设备 上 的 一 片 存储 区 。 前 两 者 
是 半导体 电路 器 件 , 以 数字 逻辑 电路 方式 进行 读 写 , 后 者 则 是 在 磁性 介质 层 中 通过 电磁 转换 
过 程 完成 信息 读 写 。 


7.2 主 存 储 器 


7.2.1 主 存储 器 概述 


主 存储 器 是 计算 机 硬件 系统 中 的 5 大 功能 部 件 之 一 ,用 于 存放 正在 运行 中 的 程序 和 相 
关 数 据 。 它 的 读 写 速度 和 存储 容量 对 计算 机 系统 的 运行 性 能 有 至 关 重 要 的 影响 ,经 常 成 为 
影响 系统 运行 性 能 的 瓶颈 。 读 写 速度 通常 用 读 、 写 一 个 存储 单元 必需 的 时 间 度量 ,例如 
60ns ,连续 两 次 读 写 必 需 的 时 间 间 隔 被 称 为 存储 周期 ,考虑 到 线路 恢复 的 延迟 问题 , 它 应 略 
大 于 一 次 主 存 读 、 写 所 用 的 时 间 。 存 储 容量 通常 用 构成 存储 器 的 字 节 数 或 字数 表述 ,一 个 存 
储 字 通常 由 2.4、8 个 字 节 组 成 。 多 数 计算 机 都 能 在 逻辑 上 同时 支持 按 字 或 字 节 读 写 主 存 


















































储 器 。 
主 存储 器 通过 地 址 总 线 .数据 总 线 .控制 总 线 与 计算 机 的 CPU 和 外 围 设备 连接 在 一 

起 ,如 图 7.3 所 示 。 地 址 总 线 
(1) 地 址 总 线 用 于 选择 主 存储 器 的 一 个 存储 单 | CPU 数据 总 线 “| 主 存储器 

元 ( 字 或 字 节 ) ,其 位 数 决定 了 可 以 访问 的 存储 单元 “| Read 上 和 一 

的 最 大 数目 , 称 为 最 大 可 寻 址 空间 。 例 如 , 当 按 字 |“ 上 上 | 

节 寻 址 时 ,20 位 的 地 址 可 以 访问 1MB 的 存储 空间 ， 连 扫 其 他 生生 导线 

32 位 的 地 址 可 以 访问 4GB 的 存储 空间 。 外 围 设备 


(2) 数据 总 线 用 于 在 计算 机 各 功能 部 件 之 间 传 ”图 7.3 主 存储 器 与 其 他 部 件 的 连接 关系 
送 数据 ,数据 总 线 的 位 数 (总 线 的 宽度 ) 与 总 线 时 钟 
频率 的 乘积 ,正比 于 该 总 线 所 支持 的 最 高 数据 吞吐 (输入 输出 ) 能 力 。 

(3) 控制 总 线 用 于 指明 总 线 的 工作 周期 类 型 和 本 次 人 /出 完成 的 时 刻 ,总线 的 工作 周期 
可 以 包括 主 存储 器 读 周期 . 主 存储 器 写 周 期 I/O 设备 读 周 期 .1/O 设备 写 周 期 , 即 区 分 要 用 
哪个 部 件 ( 主 存 或 7O 设备 ) 和 操作 的 性 质 ( 读 或 写 ) ;还 有 直接 存储 器 访问 (DMA) 总 线 周 其 
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等 。 若 在 计算 机 系统 中 使 用 了 不 同 读 写 速度 的 主 存储 器 ,在 CPU 发 出 读 写 主 存储 器 的 命 
令 后 , 它 不 能 知晓 读 写 操作 完成 的 时 刻 ,这 是 由 被 读 写 的 存储 器 (或 外 围 设 备 ) 本 身 的 运行 速 
度 决定 的 ,此 时 可 以 让 主 存储 器 本 身 提供 读 写 完 成 的 回答 信号 (Ready) ,CPU 通过 检测 该 信 
号 来 得 知 本 次 读 写 完成 的 时 刻 ; 若 为 读 操作 ,有 了 该 回答 信号 后 ,CPU 就 可 以 接收 已 读 出 的 
数据 ,如 图 7. 3 所 示 , 这 被 称 为 CPU 和 主 存储 器 按 异 步 方式 运行 。 

RAM 存储 器 芯片 中 ,通常 由 存储 阵列 、 译 码 器 、 读 写 控 制 电路 和 数据 缓冲 电路 等 部 分 
组 成 ,如 图 7.4(a) 所 示 。 其 中 的 存储 阵列 由 大 量 相同 的 基本 存储 单元 阵列 构成 ; 译 码 器 电 
路 将 来 自 CPU 输入 的 地 址 信号 翻译 成 某 单元 (存储 字 或 字 节 ) 的 选 通信 号 ,使 该 单元 能 够 
被 读 写 ;控制 电路 对 存储 芯片 进行 芯片 控制 . 读 写 控制 和 输出 控制 等 操作 ,它们 分 别 通过 CE 
(Chip Enable) .WE(Write Enable) 和 OE(Output Enable) 引 脚 实现 ;缓冲 电路 用 于 寄存 来 
自 CPU 的 写 入 数据 或 从 存储 体内 读 出 的 数据 ,具有 三 态 控制 。 注 意 , 当 芯片 控制 CE 无 效 ， 
其 他 所 有 的 信号 都 不 起 作用 , 即 芯片 不 能 工作 ;通常 OE 信 号 与 WE 信号 是 互 斥 的 , 即 进行 读 
操作 时 ,OE 信 号 为 低 ,而 WE 信号 为 高 。 

存储 器 芯片 的 译 码 方式 分 为 单 译 码 和 双 译 码 , 通 常 大 容量 存储 器 采用 双 译 码 方式 。 图 
7.4(b) 为 双 译 码 方式 结构 的 存储 器 的 示意 , 双 译 码 方式 可 以 节省 大 量 的 选 通 线 ,例如 10 条 
地 址 线 , 单 译 码 方式 需要 2" 共 1024 条 选 通 线 , 而 双 译 码 方式 仅 需要 25 十 25 共 64 条 选 通 线 。 



































地 址 线 
m~n-l 
Y 译 码 
We 1 
线 入 | 器 
地 址 线 : i : | 存储 
a | KE 矩阵 
WE |: 2" 条 
人 存储 芯片 的 内 部 组 成 (b) 存储 芯片 的 双 译 码 方式 示意 图 


图 7.4 存储 器 芯片 的 内 部 组 成 与 双 译 码 示意 图 


从 所 用 的 半导体 生产 工艺 区 分 ,RAM 存储 器 芯片 又 可 以 分 为 静态 存储 器 (SRAM) 和 
动态 存储 器 (DRAM) 两 种 类 型 。 由 于 动态 存储 器 集成 度 高 .生产 成 本 低 , 被 广泛 地 用 于 实 
现 要 求 更 大 容量 的 主 存储 器 。 静 态 存 储 器 读 写 速度 快 .生产 成 本 高 ,通常 多 用 其 实现 容量 可 
以 较 小 的 高 速 缓冲 存储 器 。 静 态 存 储 器 和 动态 存储 器 的 存储 原理 在 下 面 详细 介绍 ,它们 的 
不 同 之 处 如 表 7. 1 所 示 。 

表 7.1 静态 存储 器 与 动态 存储 器 的 区 别 











SRAM DRAM 
存储 信息 触发 器 电容 
破坏 性 读 出 非 是 
需要 刷新 非 需要 
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续 表 
SRAM DRAM 
行列 地 址 同时 送 分 两 次 送 
运行 速度 快 慢 
集成 度 高 低 
发 热量 大 小 
存储 成 本 高 低 








7.2.2 动态 存储 器 的 存储 原理 


动态 RAM 的 工作 原理 如 图 7.5(a) 所 示 ,是 由 MOS 管 的 栅 源 电容 C, 来 存储 1 位 二 进 
制 信息 的 ,并 用 一 个 MOS 管 工 来 控制 数据 的 读 写 ,C, 中 存 有 电荷 表示 1, 无 电荷 表示 0。 它 
的 特点 是 用 较 少 的 晶体 管 构成 一 个 存储 单元 ,由 此 提高 芯片 单位 面积 上 的 容量 ,同时 也 降低 
了 每 位 价格 和 功 耗 。 

当 字 选 择 线 为 低 电 平时 ,MOS 管 工 截止 ,电容 C, 上 有 无 电荷 的 情况 不 会 反映 到 工 的 
另 一 端 ; 当 字 选 择 线 为 高 电 平 时 ,MOS 管 工 导 通 ,电源 Vpp 经 电容 与 位 线 连通 ,依据 位 线 上 
的 电位 是 高 还 是 低 , 以 及 电容 C, 上 有 无 电荷 的 不 同 组 合 情 况 ,MOS 管 工 中 会 呈现 电流 有 
无 流 过 两 种 不 同情 况 。 

对 于 单 管 MOS 动态 存储 单元 ,由 于 C. 的 容量 很 小 ,电路 中 不 可 避免 地 存在 漏电 流 , 通 
常 存 储 的 信息 只 能 保持 若干 个 毫秒 ,再 由 于 动态 RAM 是 破坏 性 读 出 ,所 以 必须 对 它 进 行 刷 
新 。 注 意 ,刷新 和 读 出 都 由 刷新 和 读 出 放大 电路 完成 ,如 图 7.5(b) 所 示 。 读 出 时 , 当 列 选择 
线 有 效 , 数 据 才 通 过 Ts 送 至 芯片 的 数据 引 脚 LO; 刷 新 时 ,将 同一 行 各 存储 单元 的 信息 读 入 
刷新 和 读 出 放大 电路 ,再 写 回 原 存 储 单元 ,与 列 选 择 线 无 关 。 通 常 有 两 种 刷新 方式 。 






































图 7.5 MOS 单 管 动态 存储 器 的 组 成 


1. 集中 式 刷 新 

集中 式 刷 新 指 在 一 个 刷新 周期 内 .利用 一 段 固定 的 时 间 ,依次 对 存储 器 的 所 有 行 逐一 再 
生 , 在 此 期 间 停 止 对 存储 器 的 读 和 写 。 

例如 ,一 个 存储 器 有 1024 行 ,系统 工作 周期 为 200ns。RAM 刷新 周期 为 2ms。 这 样 ， 
在 每 个 刷新 周期 内 共有 10000 个 工作 周期 .其 中 用 于 再 生 的 为 1024 个 工作 周期 ,用 于 读 和 
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写 的 为 8976 个 工作 周期 。 
集中 刷新 的 缺点 是 在 刷新 期 间 不 能 访问 存储 器 。 
2. 分 散 式 刷新 
分 散 式 刷新 有 两 种 方法 。 


第 一 种 ,把 对 每 一 行 的 再 生 分 散 到 各 个 工作 周期 中 去 。 这 样 , 一 个 存储 器 的 系统 工作 周 
期 分 为 两 部 分 : 前 半 部 分 用 于 正常 读 、 写 或 保持 ;后 半 部 分 用 于 再 生 某 一 行 。 系 统 工作 周期 
增加 到 400ns, 每 1024 个 系统 工作 周期 可 把 整个 存储 器 刷新 一 遍 。 可 以 看 出 ,整个 存储 器 
的 刷新 周期 缩短 了 , 它 不 是 2ms, 而 是 409. 6us。 但 由 于 它 的 系统 工作 周期 为 读 、 写 所 需 时 
间 周 期 的 2 倍 ,存储 器 不 能 高 速 工作 ,在 实际 应 用 时 要 加 以 改进 。 

第 二 种 ,为 了 提高 存储 器 工作 效率 ,经 常 采取 在 2ms 时 间 内 分 散 地 将 1024 行 刷 新 一 遍 
的 方法 ,具体 做 法 是 将 刷新 周期 除 以 行 数 ,得 到 两 次 刷新 操作 之 间 的 时 间 间 隔 上 ,利用 逻辑 
电路 每 一 时 间 间 隔 :产生 一 次 刷新 请 求 。 

动态 MOS 存储 器 的 刷新 需要 有 硬件 电路 的 支持 ,包括 刷新 计数 器 、 刷 新 / 访 存 裁决 、 刷 
新 控制 逻辑 等 。 

由 于 刷新 与 列 地 址 无 关 , 同 时 为 了 减少 地 址 线 引 脚 和 节省 动态 RAM 的 体积 ,所 以 动态 
RAM 采用 地 址 复 用 的 方法 ,将 地 址 分 为 行 地 址 和 列 地 








人 一 | DAN : 数据 4 
址 ,并 且 分 别 由 行 地 址 选 通 RAS 和 列 地 址 选 通 CAS 控 了 和 A 2 
制 。 例 如 ,Intel 的 2164A 为 64KX1 的 DRAM, 图 7.6 A 40~4;: 地 址 输入 





为 芯片 的 引 脚 图 ,芯片 用 8 根 复 用 地 址 线 , 分 两 批 传送 刁 仿 。 PS 三 RAS; 行 地 址 选 通 
16 位 地 址 。 | GAS ; 列 地 址 选 通 
动态 存储 器 读 写 过 程 中 , 行 . 列 地 址 的 建立 时 间 , 读 刁 然 8 "| 三, 写 允许 
写 信号 的 建立 时 间 , 得 到 读 出 数据 提供 写 人 数据 的 时 习 砍 v3 本 

间 之 间 , 要 满足 规定 的 条 件 ( 技 术 指标 )。 限 于 篇 幅 , 我 一 一 一 
们 无 法 在 这 里 详细 讨论 这 些 线路 与 信号 时 序 问题 ,只 是 图 7.6 2164A 动态 RAM 的 引 脚 
给 出 一 些 结论 。 

CPU 向 动态 存储 器 送 地 址 是 一 次 完成 的 ,由 存储 器 芯片 内 部 的 行 地 址 和 列 地 址 锁 存 器 
线路 分 先后 接收 行列 地 址 ;执行 读 操作 时 ,为 了 保证 正常 读 出 数据 ,应 在 列 地 址 锁 存 前 建立 
读 写 命令 信号 WE( 为 高 电位 ) ,并 在 列 地址 锁 存 信号 撤销 后 再 结束 WE 信号 , 读 出 数据 送 到 
Dour 引 脚 。 

执行 写 操作 时 , 读 写 命令 信号 WE( 为 低 电 位 ) ,应 在 列 地 址 锁 存 前 建立 , 写 入 数据 Dn 也 
应 在 列 地 址 锁 存 前 建立 ,WE 和 写 入 数据 应 保持 一 定 的 时 间 。 

动态 存储 器 是 破坏 性 读 出 . 读 操作 之 后 必须 接着 执行 写 操作 ,此 时 WE 为 先 高 (执行 读 ) 
后 低 (执行 写 ) ,这 一 跳 变 时 间 要 保证 读 、 写 操作 的 正常 执行 ,如 图 7.7 所 示 。 


7.2.3 静态 存储 器 的 存储 原理 


典型 的 1 位 MOS 静态 RAM 单元 如 图 7. 8 所 示 , 它 由 6 个 MOS 管 组 成 。 
MOS 管 T 和 TT; 的 输入 .输出 交叉 耦合 组 成 双 稳 态 触发 器 ,用 于 记忆 1 位 二 进 制 信 
。 电 路 中 T: 、T, 起 着 负载 电阻 的 作用 ,例如 ,Ti 管 导 通 (T。 管 一 定 处 于 截止 ) ,输出 端 为 
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图 7.8 1 位 MOS 存储 单元 的 组 成 


低 , 则 存储 0 信号 ;反之 ,Ts 导 通 .存储 的 是 1 信号 。Ts 和 T。 能 使 触发 器 与 外 部 电路 连通 
或 隔离 ,连通 时 兼 传送 读 写 的 数据 信号 ,由 字 选 (也 称 行 选 ) 信 号 控制 ;位 选 ( 也 称 列 选 ) 信 和 号 
控制 T; 和 Ts ,使 Ti 和 Ts 传送 的 信号 传 至 芯片 的 数据 引 脚 IO。T; .Ts 是 一 列 共用 的 ,图 
中 T .Ts 下 面 的 D 和 三 也 称 位 线 1 和 位 线 2。 

大 量 的 1 位 存储 单元 可 组 成 容量 更 大 的 存储 器 芯片 ,例如 2048X1 的 芯片 , 需 将 它们 组 
织 成 64X32 的 矩阵 形式 .每 个 存储 单元 被 连接 到 不 同 的 字 选 线 、 位 选 线 的 交叉 点 处 .并 加 进 
读 写 控制 电路 ,用 地 址 译 码 器 提供 字 、 位 选择 信号 ,如 图 7.9 所 示 。 由 该 图 可 知 , 当 输入 某 地 
址 信号 ,使 对 应 的 字 、 位 选择 线 有 效 . 就 能 对 相应 的 1 位 存储 单元 进行 读 或 写 。 显 然 , 要 组 成 
2048X8 的 芯片 ,只 要 将 8 个 相同 的 芯片 作 适当 地 生 加 ,并 将 数据 信号 增加 到 8 位 ,不 需要 
增加 地 址 译 码 信 号 。 


7.2.4 存储 器 容量 扩展 


一 般 存 储 器 芯片 的 容量 是 有 限 的 , 它 在 字数 或 字 长 方面 与 实际 存储 器 的 要 求 都 有 很 大 
差距 。 在 构成 主 存储 器 的 存储 体 时 ,需要 在 字 向 和 位 向 两 方面 进行 扩充 才能 满足 实际 主 存 
储 器 的 容量 需要 。 
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图 7.9 2KB 静态 存储 器 芯片 的 逻辑 组 成 


1. 位 扩展 

位 扩展 指 的 是 加 大 字 长 。 位 扩展 的 连接 方式 是 将 多 片 存储 器 的 地 址 、 片 选读 / 写 端 连 
接 在 一 起 ,数据 端 单独 引出 。 如 图 7. 10 所 示 的 位 扩展 方式 是 用 8 个 16KX1 位 芯片 组 成 
16KX8 位 的 存储 器 。 图 中 每 个 芯片 字 长 是 1 位 ,存储 器 字 长 8 位 ,因此 它 由 8 片 芯 片 并 联 
而 成 。 每 片 有 14 条 地 址 线 引出 端 ,每 条 地 址 线 接 有 8 个 芯片 :每 片 有 1 条 数据 线 引 出 端 ,每 
条 数据 线 连接 一 个 芯片 。 在 位 扩展 时 ,没有 选 片 的 要 求 , 如 果 芯 片 有 片 选 信号 (CS) ,将 它们 
直接 接地 即 可 。 
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图 7.10 位 扩展 连接 方式 


2. 字 扩 展 

字 扩 展 指 的 是 增加 存储 器 中 字 的 数量 。 静 态 存储 器 进行 字 扩 展 时 ,将 各 芯片 的 地 址 线 、 
数据 线 . 读 / 写 控制 线 连接 在 一 起 ,而 由 片 选 信号 来 区 分 各 芯片 的 地 址 范围 。 如 图 7. 11 所 示 
的 字 扩 展 存 储 器 是 用 4 个 16KX8 位 芯片 组 成 的 64KX8 位 存储 器 。 数 据 线 De 一 D; 与 各 片 
的 数据 端 相连 ,地 址 总 线 低位 地 址 Au 一 Au 与 各 芯片 的 14 位 地 址 端 相连 ,而 两 位 高 位 地 址 
Au .Ais 经 过 译 码 器 和 4 个 芯片 的 片 选 端 相 连 。 动 态 存储 器 一 般 不 设置 CS 端 ,但 可 用 RAS 
端 来 扩展 字数 。 

3. 字 位 扩展 

实际 存储 器 往往 需要 字 向 和 位 向 同时 扩充 。 一 个 存储 器 的 容量 为 MX N 位 , 若 使 用 
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图 7.11 字 扩展 连接 方式 


LxK 位 存储 器 芯片 ,那么 ,这 个 存储 器 共 需 要 关 X 访 个 存储 器 芯片 。 


一 个 小 容量 存储 器 与 CPU 的 连接 方式 如 图 7. 12 所 示 。 存 储 器 由 Intel 2114 芯片 经 字 
位 扩展 而 成 ,容量 为 4KX8 位 。 由 于 Intel 2114 芯片 只 有 1IKX4 位 ,所 以 整个 存储 器 共 需 


于 X 生 一 8 个 2114 芯片 。Intel 2114 芯片 本 身 共有 10 个 地 址 端 (Au 一 Ay) 、4 位 数据 端 


(Du 一 D,) .一 个 片 选 端 (CS) 和 一 个 读 写 控制 信号 端 (WE)。CPU 提供 12 位 地 址 ,其 中 低 
10 位 (Au 一 As ) 并 行 连接 各 芯片 的 地 址 端 , 还 有 两 位 地 址 (Ai Au ) 连 向 译 码 器 ,产生 4 个 片 
选 信号 ,分 别 控制 4 组 芯片 。 此 处 译 码 器 要 受 CPU 的 访 存 信号 MREQ 控 制 ,只 在 需要 访问 
主 存 时 才 产生 译 码 输出 。CPU 提供 8 位 数据 总 线 (Du 一 D;) ,每 根 数据 线 连接 4 个 芯片 。 
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图 7.12 字 位 扩展 连接 方式 
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7.3 教学 计算 机 的 主 存储 器 实例 


教学 计算 机 的 基本 主 存储 器 用 由 8K 字 的 ROM 区 和 2K 字 的 RAM 区 组 成 。 主 存 字 
长 16 位 ,容量 总 共 10K 字 , 按 字 寻 址 方式 读 写 。 教 学 计算 机 选用 单 总 线 结构 , 即 CPU( 控 制 
器 和 运算 器 )、 主 存 、 串 行 接口 都 直接 连接 到 唯一 的 一 组 总 线 , 仿 真 终端 通过 串 行 接口 接 入 主 
机 系统 。 

ROM 区 选用 8KX8 位 的 EPROM 芯片 58C65 组 成 ,RAM 区 选用 2KX8 位 的 SRAM 
芯片 6116 组 成 。 

用 两 片 58C65 芯片 进行 位 扩展 ,组 成 8K 字 的 ROM 存储 区 .地址 分 配 在 0000H 一 
1FFF H (十进制 的 0 一 8191) 范 围 内 ;用 两 片 6116 芯片 进行 位 扩展 ,组 成 2K 字 的 RAM 存 
储 区 ,地 址 分 配 在 2000H~27FFH (十 进 制 的 8192 一 10239) 范 围 内 。 对 ROM 区 和 RAM 
区 完成 字 扩 展 ,构成 10K 的 主 存储 区 。 主 存储 器 的 结构 如 图 7. 13 所 示 。 
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图 7.13 教学 计算 机 主 存储 器 结构 示意 图 


1. 地 址 总 线 

地 址 总 线 ( 记 为 As 一 Au) 的 信息 统一 由 CPU 提供 ,可 以 来 自 程序 计数 器 PC 或 内 存 地 
址 寄存 器 AR, 而 地 址 寄存 器 只 接收 由 ALU 输出 的 信息 。 这 是 由 教学 计算 机 的 指令 系统 和 
硬件 结构 特点 共同 决定 的 。 地 址 总 线 的 最 高 3 位 送 往 一 个 译 码 器 线路 ,用 以 产生 主 存 芯片 
的 片 选 信号 , 低 13 位 送 到 每 个 58C65 芯片 .用 于 选择 芯片 内 的 一 个 字 单 元 ,因此 每 个 片 选 
信号 对 应 着 一 个 8K 容量 的 存储 空间 。6116 芯片 只 有 2K 容量 ,只 有 11 个 地 址 引 脚 ,不 会 
用 到 地 址 总 线 的 As 和 Au 这 两 位 。 

教学 计算 机 选用 8 位 的 IO 端口 地 址 ,由 指令 寄存 器 IR 的 低 8 位 提供 ,2 路 串口 的 端 
口 地 址 分 别 为 十 六 进 制 的 80.81 和 90、91。I/O 端口 地 址 的 高 4 位 送 到 一 个 译 码 器 线路 ,上 
于 产生 IO 接口 芯片 的 片 选 信号 , 低 4 位 将 按 接口 芯片 的 要 求 送 到 芯片 的 相应 引 脚 ,以 选择 
接口 内 不 同 的 寄存 器 。 
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2. 控制 总 线 

控制 总 线 信号 经 一 片 双 2-4 译 码 器 74LS139 和 两 片 3-8 译 码 器 芯片 74LS138 给 出 。 控 
制 总 线 的 基本 功能 ,是 用 来 指明 总 线 周期 的 类 型 和 本 次 入 /出 操作 完成 的 时 刻 。 教 学 计算 机 
中 的 基本 总 线 周 期 类 型 包括 主 存 写 、 主 存 读 、 外 设 ( 接 口 ) 写 、 外 设 ( 接 口 ) 读 4 类 ,分 别 用 
MMW MMR IOW IOR 这 4 个 信号 标记 ,并 用 MMREQ 和 IOREQ 来 区 分 是 主 存 工作 还 是 
外 设 工 作 。 这 些 信号 的 产生 是 通过 3 位 控制 码 来 确定 的 。 更 深 一 步 说 ,这 3 位 控制 码 又 是 
依据 主 存 读 写 .1/O 读 写 操作 的 需求 来 赋值 的 , 即 MIO .REQ WE 取 值 为 000.001.010.011、 
1XX 时 ,分 别 表 示 主 存 写 . 主 存 读 .IO 写 .I/O 读 、 无 读 写 (NC) 功 能 。 

为 简化 设计 与 实现 , 主 存储 器 和 CPU 以 同步 方式 交换 信息 ,可 在 一 个 时 钟 周期 完成 ; 
执行 输入 输出 操作 选用 程序 直接 控制 方式 ,需要 CPU 通过 查询 串 行 接口 的 运行 状态 来 实 
现 与 输入 输出 设备 (仿真 终端 ) 的 同步 。 

3. 数据 总 线 

数据 总 线 是 在 计算 机 各 功能 部 件 之 间 完 成 数据 传送 的 线路 。 它 的 工作 速度 (总 线 时 钟 
频率 ) 和 位 数 ( 宽 度 ) 的 乘积 决定 了 总 线 上 最 大 的 数据 传送 率 。 

在 教学 计算 机 中 数据 总 线 16 位 ,由 于 系统 采用 的 是 单 总 线 结构 ,因此 运算 器 ,控制 器 、 
主 存储 器 和 串 行 接口 的 数据 入 出 引 脚 都 直接 连接 到 数据 总 线 DB, 包 括 用 于 向 教学 机 提供 
调试 用 数据 的 开关 (经 过 带 有 三 态 控制 的 74LS244 芯片 ) 的 输出 也 需要 连接 到 DB。 

设计 和 使 用 总 线 的 核心 技术 ,是 要 保证 在 任何 时 刻 只 能 把 一 组 数据 发 送 到 总 线 上 ,但 允 
许 一 到 多 个 部 件 同 时 接收 总 线 上 的 信息 。 为 此 ,对 多 个 申请 发 送 数 据 到 总 线 上 的 部 件 , 必 须 
进行 选择 控制 ,确保 它们 以 分 时 方式 共享 总 线 。 所 用 的 电路 通常 为 带 有 高 阻 态 输出 的 三 态 
门 电路 ,如 图 7. 14 所 示 。 输 入 端 标 记 为 In, 输 出 端 标记 为 Out.C 为 控制 端 。 当 C 为 低 电 平 
时 ,该 线路 的 功能 是 Out=In; 当 C 高 电 平时 ,输出 Out 则 为 高 阻 态 。 

我 们 很 容易 用 这 样 的 线路 构建 数据 总 线 。 如 图 7.15 所 示 。 
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图 7.14 三 态 门 电路 图 图 7.15 选用 三 态 门 构建 总 线 


把 不 同 部 件 的 输出 经 三 态 门 连接 到 总 线 上 ,通过 一 组 控制 信号 Ci(i 二 1,2,3,…) 选 择 送 
入 总 线 的 数据 。 若 做 到 在 任何 时 刻 , 在 多 个 控制 信号 中 只 有 一 个 为 低 电 平 ,而 其 他 信和 号 均 为 
高 电 平 , 就 能 确保 了 多 个 部 件 能 在 不 同 的 时 刻 分 别 向 总 线 发 送 数据 。 若 有 多 于 1 个 的 控制 
信号 同时 为 低 电 平 , 则 是 严重 错误 ,会 造成 多 个 缓冲 门 的 输出 短路 ,使 总 线 上 的 信息 混乱 , 甚 
至 烧 坏 器 件 。 为 此 ,用 译 码 器 线路 给 出 这 类 控制 信号 是 一 种 比较 理想 的 方案 。 

从 总 线 上 向 外 传送 数据 ,重点 是 解决 线路 的 负载 与 驱动 能 力 问 题 。 由 于 总 线 驱动 的 部 
件 可 能 较 多 ,又 往往 有 较 长 的 传送 路 径 ,要 求 总 线 所 用 器 件 有 比较 强 的 驱动 能 力 。 

4. 系统 时 钟 及 时 序 

计算 机 各 功能 部 件 都 是 在 时 钟 信 号 的 “驱动 "下 一 步 一 步 地 协调 运行 并 执行 各 自 的 功 
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。 从 系统 运行 速度 上 考虑 ,总 是 希望 在 系统 能 正常 运行 的 前 提 下 ,使 系统 时 钟 频率 尽量 高 
一 此 

教学 计算 机 无 意 追 求 运行 速度 。 从 支持 串 行 接口 芯片 Intel 8251 所 要 求 的 时 钟 频率 考 
虑 ,教学 计算 机 选用 了 1. 8432MHz 的 晶振 ,6 分 频 后 用 307. 2kHz 的 时 钟 作 为 系统 主 时 钟 
(也 可 以 选择 另外 几 个 频率 ) ,其 波形 如 图 7.16 所 示 , 既 用 于 CPU, 也 用 于 1/O 总 线 , 并 保持 
CPU 与 主 存 . 串 口 读 写 操作 的 同步 运行 。 

CPU 内 部 的 某 些 寄存 器 ,通常 用 该 时 钟 信号 结束 时 的 上 升 沿 完成 接收 操作 (边沿 控制 
方式 ) ,这 意味 着 每 个 时 钟 脉冲 时 间 对 应 一 条 微 指令 的 时 间 , 即 一 个 微 周 期 ,或 称 一 个 CPU 
周期 。 只 有 运算 器 内 的 通用 寄存 器 是 用 时 钟 脉冲 的 低 电 平 接收 输入 ( 电 平 控制 方式 ) 。 

在 执行 主 存 或 1/O 读 写 操作 时 ,每 个 总 线 周 期 通常 由 两 个 时 钟 周期 组 成 。 第 一 个 时 钟 
周期 被 称 为 地 址 时 间 , 用 于 传送 主 存 地 址 或 IO 端口 地 址 ;第 二 个 时 钟 周期 被 称 为 数据 时 
间 , 用 于 读 写 数据 。 由 于 所 选 的 时 钟 频率 相当 低 ,一 次 数据 时 间 足 以 完成 主 存 读 写 操作 ,这 
就 是 常 说 的 在 总 线 的 零 等 待 状态 完成 数据 读 写 。 在 另外 一 些 计算 机 中 , 若 一 次 数据 时 间 不 
能 完成 主 存 或 IJ/O 设备 的 读 写 操作 ,就 可 以 增加 1 到 多 个 数据 时 间 ( 多 个 时 钟 脉冲 时 间 ), 这 
增加 了 的 数据 时 间 被 称 为 总 线 的 等 待 状态 , 它 降低 了 系统 的 输入 输出 能 力 。 在 教学 计算 机 
系统 中 ,仿真 终端 的 输入 输出 操作 以 程序 直接 控制 方式 运行 ,会 用 掉 很 多 CPU 时 间 。 

综 上 所 述 , 存 储 器 读 写 涉及 地 址 信息 、 读 出 与 写 入 的 数据 内 容 、 片 选 信号 和 读 写 操作 命 
令 信 号 ,它们 之 间 在 时 序 配 合 上 要 满足 某 些 条 件 。 例 如 ,有 了 稳定 的 地 址 与 片 选 信号 才 可 以 
读 , 有 了 稳定 的 地 址 和 写 人 的 数据 后 .有 了 片 选 信号 才能 再 给 出 写 命令 ,以 便 保证 无 误 的 写 
操作 。 此 外 ,这 些 信 号 应 有 一 定 的 持续 时 间 ,以 保证 读 写 操作 得 以 正常 完成 。 


7.4 提高 主 存储 器 性 能 的 途径 


1. 动态 存储 器 的 快速 读 写 技术 

读 写 动态 存储 器 时 ,通常 需要 为 存储 器 芯片 先后 分 别 锁 存 行 地 址 和 列 地 址 ,比较 费时 
间 ,如 果 连 续 读 写 属 于 同一 行 的 多 个 列 中 的 数据 ,其 行 地 址 只 需 在 第 一 次 读 写 时 送 入 ( 锁 
存 ) ,之 后 保持 不 变 , 则 每 次 读 写 属 于 该 行 的 多 个 列 中 的 数据 时 ,每 次 仅 锁 存 列 地 址 即 可 ,从 
而 省 掉 了 锁 存 行 地 址 时 间 , 也 就 加 快 了 主 存储 器 的 读 写 速度 。 这 一 技术 被 称 为 动态 存储 器 
的 快速 读 写 技术 ,或 称 为 快速 页 式 工作 技术 ,这 是 动态 存储 器 所 特有 的 用 法 。 


2. 主 存储 器 的 并 行 读 写 技术 
数据 总 线 





























ld ae a 多 
个 主 存 字 所 采用 的 技术 ,在 静态 或 动态 存储 器 中 均 可 使 用 。: 

第 一 种 方案 是 一 体 多 字 方 案 ,通过 加 宽 每 个 主 存单 元 i ~ 章 | 
的 宽度 , 即 增加 每 个 主 存单 元 所 包括 的 数据 位 数 .使 每 个 
主 存单 元 同时 存储 几 个 主 存 字 , 则 每 一 次 读 操作 就 同时 读 和 
出 了 几 个 主 存 字 , 使 读 出 一 个 主 存 字 的 平均 读 出 时 间 变 为 

















原来 (与 每 个 单元 存 一 个 字 相 比 ) 的 几 分 之 一 。 其 缺点 是 ， Ti 
每 次 读 出 的 几 个 主 存 字 必 须 首先 保存 在 一 个 位 数 足 够 长 地 址 寄存 器 
的 寄存 器 中 ,等 待 通过 数据 总 线 分 几 次 把 它们 传送 走 。 图 7. 17 图 立 存 的 - 济 梳 逢 拂 结构 
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7.17 给 出 了 这 一 方案 的 示意 表示 。 

第 二 种 方案 是 更 加 常用 的 办 法 , 称 为 多 体 交 叉 编 址 技术 ,把 主 存储 器 分 成 几 个 能 独立 读 
写 , 字 长 为 一 个 主 存 字 的 主体 ,这 样 就 可 以 按 读 写 需 要 情况 ,分 别 对 几 个 存储 体 执行 读 写 , 通 
过 合理 的 组 织 方式 ,使 几 个 存储 体 协 同 运 行 ,从 而 提供 出 比 单个 存储 体 更 高 的 ( 几 倍 ) 读 写 速 
度 。 合 理 地 对 这 多 个 存储 体 进行 组 织 ,涉及 如 下 两 个 问题 。 

首先 是 怎么 对 这 些 存储 体 执 行 读 写 , 可 以 用 两 种 方式 进行 处 理 。 一 是 在 同一 个 读 写 周 
期 同时 启动 所 有 存储 体 的 读 或 写 操作 ,这 与 前 面 讲 的 一 体 多 字 方 案 很 类 似 ; 二 是 使 这 些 存储 
体 顺序 地 轮流 启动 各 自 的 读 写 周期 ,理论 上 能 达到 的 最 高 读 写 速度 ,是 在 一 个 读 写 周 期 内 ， 
能 启动 每 一 个 存储 体 的 读 写 操作 , 即 启动 相 邻 两 个 存储 体 的 最 小 时 间 间 隔 , 要 小 于 或 等 于 一 
个 读 写 周期 除 以 存储 体 的 个 数 。 这 种 方案 的 优点 ,是 依次 读 出 来 的 每 一 个 存储 字 , 可 以 直接 
通过 数据 总 线 依次 传送 走 , 而 不 必 设 置 专门 的 数据 缓冲 寄存 器 。 

其 次 是 如 何 分 配 这 些 存储 体 各 自 工作 的 地 址 范围 。 合 理 的 方案 是 交叉 编 址 , 即 把 连续 
地 址 的 几 个 主 存 字 依次 分 配 在 不 同 的 存储 体 中 ,因为 程序 运行 的 局 部 性 特性 已 经 表明 ,程序 
运行 过 程 中 ,在 短 时 间 内 读 写 地 址 相 邻 的 主 存 字 的 概率 更 大 。 假 定 有 M 个 存储 体 ,每 个 存 
储 体 的 容量 为 二 , 则 第 mr 个 存储 体 中 存储 的 主 存 字 的 地 址 应 为 





mx¥jti 
其 中 
J 一 0,1,2,…, 工 一 1， 1 一 0,1,2,……,M 一 1 
在 这 种 编 址 方式 中 ,地 址 寄存 器 送 到 主 存储 器 的 地 址 的 低 几 位 (例如 对 4 个 存储 体 的 情 
形 为 低 2 位 ) ,用 于 区 分 读 写 哪 个 存储 体 ,其 余 高 位 部 数据 总 线 





分 送 到 每 个 存储 体 , 用 于 区 分 读 写 每 个 存储 体 的 哪 一 | i | | 
个 存储 字 。 图 7. 18 给 出 了 该 方案 的 原理 示意 图 。 

3. 关于 对 成 组 数据 传送 的 支持 | ||| 

成 组 传送 数据 的 方式 (Burst Mode) 是 指 用 于 提高 
在 数据 总 线 上 的 数据 输入 输出 能 力 的 一 种 技术 , 即 通 
过 地 址 总 线 传送 一 次 地 址 后 ,能 连续 在 数据 总 线 上 传 
送 多 个 (一 组 ) 数 据 ,而 不 像 正常 总 线 工 作 方式 (Normal 
Mode) 那 样 ,每 传送 一 次 数据 ,总 要 用 两 段 时 间 , 即 先 
送 一 次 地 址 (地 址 时 间 ), 后 跟 一 次 数据 传送 (数据 时 图 7.18 主 存 的 多 体 交叉 编 址 技术 
间 )。 在 成 组 传送 方式 中 ,为 传送 N 个 数据 ,就 可 以 仅 
用 N 十 1 个 总 线 时 钟 周期 ,而 不 再 是 用 2XN 个 总 线 时 钟 周期 ,使 总 线 上 的 数据 IVO 尖峰 值 
提高 一 倍 。 

显然 ,实现 数据 成 组 传送 .不 仅 是 计算 机 总 线 一 个 方面 的 问题 ,也 与 提供 数据 来 源 ( 读 ) 
或 数据 去 处 ( 写 ) 的 主 存储 器 直接 有 关 。 换 言 之 ,实现 数据 成 组 传送 .CPU 就 要 支持 这 种 运 
行 方式 (486 以 上 型 号 的 PC 才 有 此 项 支持 )。 主 存储 器 也 应 能 提供 出 足够 高 的 数据 读 写 速 
度 , 这 往往 通过 主 存 的 多 体 结构 .动态 存储 器 的 EDO 支持 等 措施 来 实现 。 这 种 支持 可 以 在 
PC 的 内 存 条 一 级 体现 ,也 可 能 在 存储 器 的 芯片 一 级 就 有 所 体现 。 

4. 其 他 可 行 方案 

存储 器 系统 的 性 能 主要 表现 为 读 写 速度 和 存储 容量 两 个 方面 。 从 进一步 提高 主 存储 器 
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多 级 结 鸥 疗 储 器 系统 和 主 阁 人 笠 器 





部 件 的 读 写 速 度 考虑 ,可 以 从 提高 存储 器 芯片 本 身 的 读 写 速度 ,改进 芯片 之 间 的 组 合 与 结构 
关系 两 个 角度 来 加 以 解决 。 例 如 ,使 用 增强 型 的 动态 存储 器 芯片 EDRAM CDRAM 等 方 
案 , 使 用 同步 动态 存储 器 芯片 SDRAM ,改进 芯片 之 间 的 组 合 与 结构 关系 ,或 者 选用 具有 多 
端口 的 存储 器 芯片 等 ,都 能 达到 更 好 的 性 能 。 具 体内 容 请 参阅 其 他 资料 ,这 里 从 略 。 


本 章 内 容 小 结 和 学 习 方法 建议 


本 章 中 对 为 什么 要 使 用 多 级 结构 来 构建 存储 器 系统 进行 了 说 明 。 并 且 解 释 了 程序 运行 
的 局 部 性 原理 和 多 级 结构 存储 器 系统 中 需要 满足 的 一 致 性 原则 和 包含 性 原则 ,这 是 学 习 第 
7 一 9 章 的 概述 性 内 容 。 

主 存储 器 ,又 称 内 存储 器 ,其 容量 与 读 写 速度 等 指标 对 计算 机 总 体 性 能 有 着 重大 影响 。 
当前 多 用 动态 存储 器 芯片 实现 , 它 的 运行 速度 比 CPU 要 慢 得 多 ,其 容量 往往 难以 满足 系统 
使 用 的 要 求 ,需要 到 存储 器 系统 中 找到 解决 方案 。 以 教学 计算 机 的 存储 器 为 例 , 介 绍 了 存储 
器 设计 中 的 字 、 位 扩展 技术 ,存储 器 与 CPU 的 连接 关系 等 内 容 , 这 是 本 章 的 重点 教学 内 容 。 
有 关 存 储 器 芯片 的 内 部 结构 和 读 写 原理 等 ,大 体 属 于 线路 方面 的 知识 ,可 以 适当 地 少 花 一 点 
精力 。 提 高 主 存 器 性 能 的 思路 和 解决 方案 还 是 应 该 适当 了 解 一 些 。 


习题 与 思考 题 


1. 在 计算 机 中 ,为 什么 要 采用 多 级 结构 的 存储 器 系统 ? 它 的 应 用 是 建立 在 程序 的 什么 
特性 之 上 的 ? 

2. 多 级 结构 的 存储 器 是 由 哪 3 级 存储 器 组 成 的 ?每 一 级 存储 器 使 用 什么 类 型 的 存储 
介质 ?这 些 介质 的 主要 特性 是 什么 ? 在 多 级 结构 的 存储 器 系统 中 ,何谓 信息 的 一 致 性 原则 
和 包含 性 原则 ? 

3. 比较 DRAM 和 SRAM 芯片 的 主要 特性 。 

4. 衡量 主 存 储 器 的 性 能 主要 看 哪 几 项 指标 ? 应 该 如 何 确定 主 存储 器 的 字 长 ? 

5. 为 什么 在 一 些 大 型 的 计算 机 系统 中 ,通常 总 要 使 主 存储 器 可 以 按 字 节 (8 位 )、 半 字 
(16 位 ). 字 (32 位 ) 甚 至 于 双 字 (64 位 ) 来 寻 址 呢 ? 

6. 在 主 存储 器 系统 中 ,ROM 区 的 主要 作用 是 什么 ?是 不 是 计算 机 系统 中 都 应 有 ROM 
存储 区 呢 ? 

7. 为 什么 当前 的 计算 机 系统 中 ,多 选用 DRAM 芯片 组 成 主 存储 器 ? 你 能 解释 为 什么 
在 教学 计算 机 系统 中 要 用 SRAM 组 成 主 存储 器 吗 ? 

8. 为 什么 动态 存储 器 会 是 破坏 性 读 出 ? 为 什么 静态 存储 器 读 出 操作 不 会 破坏 已 存储 
的 信息 呢 ? 

9. 动态 存储 器 为 什么 要 定期 刷新 ? 为 什么 刷新 操作 能 够 以 行为 单位 进行 ? 为 什么 不 
以 字 为 单位 执行 刷新 操作 呢 ?” 有 哪 两 种 最 常用 的 刷新 方式 ?它们 各 自 的 优 缺 点 是 什么 ? 刷 
新 操作 对 存储 器 性 能 有 影响 吗 ? 

10. 存储 器 读 写 操作 时 ,地 址 信号 . 片 选 信号 . 读 写 命令 . 读 出 的 数据 或 写 入 的 数据 ,在 
时 间 配 合 上 要 满足 什么 关系 ? 
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11. 在 所 用 主 存储 器 芯片 已 确定 的 情况 下 ,还 要 进一步 大 幅度 提高 主 存储 器 系统 的 读 
写 速度 的 办 法 是 什么 ? 
12. 主 存 一 体 多 字 和 多 体 交 叉 方 案 的 优 缺 点 各 表现 在 什么 地 方 ? 低位 地 址 的 多 体 交 叉 
是 何 含义 ? 优点 何在 ? 
13. 下 列 各 类 存储 器 中 ,不 采用 随机 存 取 方 式 的 是 
A. EPROM B. CDROM C. DRAM D. SRAM 
14. 下 列 有 关 RAM 和 ROM 的 叙述 中 ,正确 的 是 
I. RAM 是 易 失 性 存储 器 ,ROM 是 非 易 失 性 存储 器 
[. RAM 和 ROM 都 采用 随机 存 取 方式 进行 信息 访问 
上 RAM 和 ROM 都 可 用 作 Cache 
RN. RAM 和 ROM 都 需要 进行 刷新 
A. 仅 工 和 工 B. 仅 开 和 看 C. 仅 I 、I[、 本 D. 仅 I[ 人、N 
15. 某 计算 机 存储 器 按 字 节 编 址 , 主 存 地 址 空间 大 小 为 64MB , 现 用 4MX 8 位 的 RAM 
芯片 组 成 32MB 的 主 存 器 , 则 存储 器 地 址 寄存 器 MAR 的 位 数 至 少 是 
A. 22 位 B. 23 位 C. 25 位 D. 26 位 
16. 某 计 算 机 主 存 容量 为 64KB, 其 中 ROM 区 为 4KB, 其 余 为 RAM 区 , 按 字 节 编 址 。 
先 要 用 2KX8 位 的 ROM 芯片 和 4KX4 位 的 RAM 芯片 来 设计 该 存储 器 , 则 需要 上 述 规格 


的 ROM 芯片 数 和 了 RAM 芯片 数 分 别 是 
Dh 锋 下 :多 Cli30 D; 2.30 
17. 假定 用 若干 个 2KX4 位 芯片 组 成 一 个 8KX8 位 的 存储 器 , 则 地 址 OBIFH 所 在 芯 
片 的 最 小 地 址 是 2 


A. 0000H B. 0600H C. 0700H D. 0800H 





第 8 齐 
高 速 缓冲 存储 器 和 虚拟 存储 器 


在 高 速 缓冲 存储 器 一 节 ,主要 介绍 高 速 缓冲 存储 器 的 构成 、 功 能. 读 写 原理 、 提 高 命中 率 
的 可 行 方案 等 内 容 。 通 常情 况 下 ,高 速 缓冲 存储 器 对 用 户 来 说 是 透明 的 ,用 户 无 须 了 解 它 是 
如 何 和 运行 的 ,甚至 于 不 知道 它 是 否 存在 ,照样 能 设计 并 运行 自己 的 程序 。 但 是 ,高 速 缓冲 存 
储 器 是 计算 机 硬件 的 重要 组 成 部 分 之 一 ,还 是 应 该 了 解 它 的 构成 方式 (3 种 基本 映像 ) 和 读 
写 原 理 ( 以 关联 存储 器 方式 存储 和 读 出 数据 ) 等 基本 知识 。 

在 虚拟 存储 器 一 节 , 介 绍 过 虚拟 存储 器 的 概念 和 功能 之 后 ,重点 讲解 了 段 式 和 页 式 存储 
管理 2 种 方案 的 硬件 组 成 ,从 逮 辑 地 址 到 内 存 地 址 的 转换 过 程 , 属 于 入 门 性 的 知识 。 


8.1 高 速 缓冲 存储 器 


高 速 缓冲 存储 器 (Cache) 是 一 个 相对 于 主 存 来 说 容量 很 小 .速度 特快 ,用 静态 存储 器 器 
件 实现 的 存储 器 系统 。 它 的 作用 在 于 缓解 主 存 速度 慢 、 跟 不 上 CPU 读 写 速度 要 求 的 矛盾 。 
它 的 实现 原理 是 把 CPU 最 近 最 可 能 用 到 的 少量 信息 (数据 或 指令 ) 从 主 存 复 制 到 Cache 中 ， 
当 CPU 下 次 再 用 这 些 信 息 时 ,就 不 必 访问 慢 速 的 主 存 , 而 直接 从 快速 的 Cache 中 得 到 ,从 而 
提高 了 得 到 这 些 信 息 的 速度 ,使 CPU 有 更 高 的 运行 效率 。 

这 里 讨论 的 是 在 “缓存 - 主 存 ” 层 次 遇 到 的 问题 。 问 题 的 焦点 就 集中 到 到 底 能 有 多 大 的 
概率 ,CPU 可 以 从 Cache 中 得 到 原本 应 该 到 主 存 中 去 取得 的 信息 ,这 是 评价 Cache 运行 性 
能 的 关键 指标 ,被 称 为 Cache 的 命中 率 。 造 成 这 一 问题 的 根源 ,是 Cache 的 容量 远 远 小 于 主 
存 , 它 所 存放 的 内 容 只 是 主 存 内 容 的 很 小 一 部 分 。 为 此 ,必须 找 出 一 整套 方案 ,从 Cache 的 
读 写 原理 ,Cache 的 容量 设置 ,确定 Cache 存储 单元 与 主 存 哪 一 个 单元 是 对 应 关系 , 主 存 和 
Cache 每 次 交换 数据 的 单位 量 、 交 换 的 时 刻 ,Cache 接 入 计算 机 系统 中 的 方式 等 多 方面 ,来 
解决 Cache 速度 .命中 率 等 一 系列 问题 。 这 些 正 是 在 本 节 要 讨论 的 主要 内 容 。 


8.1.1 Cache 的 运行 原理 


高 速 缓冲 存储 器 的 运行 原理 与 主 存储 器 的 运行 原理 有 很 大 区 别 。 主 存储 器 运行 原理 是 
建立 在 每 个 主 存 地 址 对 应 主 存 的 一 个 存储 单元 这 一 关系 之 上 的 。 在 计算 机 程序 中 ,要 使 用 
主 存 某 单元 中 的 数据 ,必须 在 指令 中 给 出 该 单元 的 地 址 。 读 操作 时 ,给 出 这 一 地 址 后 ,通过 
译 码 电路 ,就 可 以 选中 主 存 中 被 读 的 一 个 存储 单元 ,执行 读 操 作 , 读 出 的 信息 就 是 需要 的 数 
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据 。 而 高 速 缓冲 存储 器 的 运行 原理 则 完全 不 同 , 由 于 其 存储 容量 很 小 ,无 法 通过 对 原本 用 于 
读 主 存 的 地 址 直接 进行 译 码 来 选择 一 个 Cache 单元 。 

找到 一 个 主 存单 元 所 对 应 的 Cache 单元 最 简单 的 办 法 是 合理 设计 Cache 存储 器 的 组 织 
形式 。 例 如 ,使 Cache 的 每 个 存储 单元 由 3 部 分 内 容 组 成 。 第 一 部 分 内 容 是 Cache 的 数据 
字段 ,保存 从 主 存 某 一 单元 复制 过 来 的 数据 内 容 , 这 是 在 CPU 第 一 次 读 出 该 主 存 字 时 完成 
的 ,在 把 读 出 内 容 传送 到 CPU 的 同时 ,顺便 将 该 内 容 写 进 一 个 选中 的 Cache 单元 的 数据 字 
段 。 第 二 部 分 内 容 是 Cache 的 标志 字段 ,保存 相应 主 存单 元 的 地 址 信息 ,是 在 复制 主 存单 元 
的 数据 内 容 的 同时 ,把 该 主 存单 元 的 地 址 写 进 这 一 标志 字段 的 ,用 它 指明 该 Cache 单元 的 数 
据 字段 部 分 保存 的 数据 是 从 哪 一 个 主 存单 元 复制 过 来 的 。 当 程序 中 的 一 条 指令 要 用 一 个 主 
存 地 址 读 主 存 的 某 一 单元 时 ,就 用 这 一 地 址 来 与 Cache 中 的 各 个 标志 字段 的 内 容 相 比较 , 若 
找到 某 一 标志 字段 的 内 容 与 该 地 址 值 相同 , 则 同一 Cache 单元 的 数据 字段 中 的 数据 内 容 可 
能 就 是 被 读 的 数据 ;这 表明 , 读 Cache 时 ,是 用 Cache 单元 内 容 的 一 部 分 (标志 字段 ) 的 值 ( 原 
本 用 于 读 主 存 的 一 个 地 址 ) ,来 确定 该 Cache 单元 另外 一 部 分 (数据 字段 ) 的 内 容 是 否 就 是 要 
读 的 数据 。 以 这 种 原理 运行 的 存储 器 被 称 为 关联 (联想 ) 存 储 器 。 第 三 部 分 内 容 是 Cache 单 
元 的 有 效 位 字段 ,规定 其 值 为 1, 表示 该 Cache 单元 中 的 标志 字段 .数据 字段 的 内 容 是 有 效 
的 ,为 0, 则 说 明 该 Cache 单元 在 此 之 前 尚未 使 用 ,其 标志 字段 ,数据 字段 的 内 容 是 无 效 的 。 
有 效 位 字段 的 内 容 , 应 在 Cache 刚 投入 使 用 时 , 清 每 个 单元 的 有 效 位 为 0; 在 一 个 Cache 单 
元 被 选中 , 且 数据 字段 ,地址 字段 的 内 容 完成 写 人 操作 之 后 ,该 单元 的 有 效 位 亦 被 置 为 1, 表 
明 该 单元 已 被 占用 ,其 标志 字段 .数据 字段 的 内 容 是 有 效 的 。 

图 8. 1 给 出 了 Cache 存储 器 最 简单 的 读 出 原理 ,现在 不 妨 先 假定 该 Cache 的 一 个 存储 
单元 与 一 个 主 存 字 相对 应 。Cache 存储 器 要 正常 进 地 址 总 线 
行 工作 ,当然 还 要 有 自己 的 管理 逻辑 部 分 ,这 一 部 分 
内 容 到 后 面 有 关 部 分 再 介绍 。 

当然 ,实用 的 Cache 存储 器 总 会 在 简单 原理 的 基 
础 上 采取 一 定 的 完善 措施 ,以 便 尽 可 能 地 提高 Cache 
性 能 ,降低 实现 成 本 。 这 些 完善 措施 包括 以 下 4 个 “名 出 元 “MEMORY 
方面 。 

(1) Cache 单元 不 一 定 非 要 以 字 为 单位 与 主 存 实 
现 相 互 对 应 ,因为 以 一 个 字 为 对 应 单位 ,Cache 单元 
中 的 标志 字段 的 长 度 必 须 能 存放 一 个 主 存单 元 的 完整 的 字 地 址 ,占用 的 位 数 偏 多 ,使 Cache 
的 总 容量 变 大 ,而 且 实 现 主 存 地 址 与 Cache 的 标志 字段 比较 的 数量 也 变 多 (与 Cache 中 所 有 
有 效 位 为 1 的 存储 单元 都 比较 到 ) .不 利于 提高 Cache 的 运行 性 能 和 降低 其 实现 成 本 。 更 常 
用 的 方案 是 以 几 个 字 组 成 的 字 块 (Cache Line Size) 为 单位 实现 对 应 关系 。 

(2) Cache 与 主 存 交换 信息 时 ,也 不 是 每 次 以 一 个 主 存 字 为 单位 进行 交换 ,如 果 CPU 
在 读 一 个 主 存 字 时 ,顺便 把 该 字 之 后 的 几 个 字 也 写 进 Cache, 则 CPU 再 用 到 这 几 个 字 时 ,由 
于 这 几 个 字 已 在 Cache 中 ,CPU 就 可 以 快速 从 Cache 中 得 到 ,而 不 必 每 次 去 读 速 度 更 慢 的 
主 存储 器 ,从 而 提高 了 计算 机 系统 的 运行 效率 。 更 常用 的 方案 是 每 次 以 几 个 字 组 成 的 字 块 
为 单位 实现 二 者 之 间 的 信息 传送 , 字 块 大 小 一 般 为 4 一 32 个 字 节 。 

(3) Cache 单元 与 主 存单 元 的 对 应 关系 ,也 可 以 有 多 种 不 同 的 方式 ,例如 完全 随意 对 
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图 8.1 Cache 存储 器 读 出 简单 原理 
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应 ,一 对 多 的 硬性 对 应 ,多 对 多 的 有 限 随意 对 应 等 。 

(4) Cache 的 容量 设置 .Cache 的 分 层 组 织 `.Cache 接 人 计算 机 系统 中 的 方式 等 ,也 是 设 
计 与 使 用 Cache 过 程 中 必须 考虑 的 问题 。 

这 里 讨论 的 还 只 限于 对 Cache 的 读 操作 ,对 Cache 写 操 作 还 会 有 其 他 需要 解决 的 问题 。 
下 面 会 分 别 详细 讲解 。 


8.1.2 Cache 的 3 种 映像 方式 


前 面 已 讲 到 ,在 把 一 个 主 存单 元 的 数据 复制 到 Cache 中 时 ,还 要 把 该 主 存单 元 的 地 址 ， 
经 过 某 种 函数 关系 处 理 后 写 进 Cache 的 标志 字段 ,这 一 过 程 被 称 为 Cache 的 地 址 映像 。 在 
程序 执行 时 ,还 要 把 主 存 地 址 变换 为 访问 Cache 的 地 址 ,这 一 过 程 被 叫 作 Cache 的 地 址 变 
换 。 地 址 映像 和 地 址 变换 的 处 理 方案 是 密切 相关 的 。 

Cache 存储 器 通常 使 用 3 种 映像 方式 ,它们 是 全 相 联 映像 方式 、 直 接 映像 方式 、 多 路 组 
相 联 映像 方式 。3 种 映像 方式 有 各 自 的 优 缺点 。 

1. 全 相 联 映像 方式 

全 相 联 映像 方式 是 指 主 存 的 一 个 字 ( 字 块 ) 可 以 映像 到 整个 Cache 的 任何 一 个 字 ( 字 块 ) 
中 , 反 过 来 说 ,Cache 的 一 个 字 ( 字 块 ) 中 ,在 不 同时 刻 可 能 存放 的 是 整个 主 存 中 的 任何 一 
字 ( 字 块 ) 中 的 内 容 , 即 二 者 的 对 应 关系 是 完全 随意 的 ,没有 任何 强制 性 的 限制 条 件 。 这 种 方 
案 的 优点 是 明显 的 ,对 Cache 的 使 用 可 以 有 最 大 的 灵活 性 ,只 要 Cache 中 尚 有 空闲 的 单元 ， 
又 有 新 的 主 存单 元 的 内 容 要 写 人 Cache 时 ,确保 能 执行 这 次 写 操 作 。 当 Cache 已 满 , 即 所 有 
单元 都 被 占用 ,又 有 新 的 主 存单 元 的 内 容 要 写 人 Cache 丰 
时 ,可 以 比较 方便 地 选择 一 个 Cache 单元 进行 腾空 , 接 各 
着 完成 这 次 写 人 操作 。 全 相 联 映像 方式 缺点 也 是 致命 
的 ,在 执行 Cache 读 写 操作 时 ,用 原本 读 主 存 的 整个 (或 
部 分 ) 地 址 去 与 Cache 的 标志 字段 的 内 容 实 现 比较 时 ， 
必须 与 整个 Cache 中 每 一 个 单元 的 标志 字段 都 比较 到 ， 
才能 知晓 要 读 的 信息 是 否 已 在 Cache 中 。 由 于 实现 这 
一 比较 操作 的 电路 过 多 过 于 复杂 ,其 实现 成 本 太 高 而 难 
以 实用 , 仅 在 Cache 容量 很 小 时 方 可 选用 。 图 8. 2 给 出 
了 这 一 方案 的 原理 示意 图 。 图 8.2 全 相 联 映像 方式 

2. 直接 映像 方式 

直接 映像 方式 是 指 主 存 的 一 个 字 ( 字 块 ) 只 能 映像 到 Cache 的 一 个 唯一 确定 的 字 ( 字 
块 ) 中 , 反 过 来 说 ,Cache 的 一 个 字 ( 字 块 ) 中 ,在 不 同时 刻 存 放 的 仅 能 是 整个 主 存 中 确定 的 某 
些 字 ( 字 块 ) 中 的 一 个 字 ( 字 块 ) 的 内 容 . 即 二 者 的 对 应 关系 是 完全 硬性 确定 的 ,没有 任何 选择 
余地 。 这 种 方案 的 优点 是 实现 与 标志 字段 比较 的 线路 简单 ,成 本 低 ; 缺 点 是 对 Cache 的 使 用 
缺乏 灵活 性 ,影响 命中 率 。 它 的 运行 原理 简 述 如 下 。 

在 逻辑 上 ,把 主 存 划分 成 容量 等 于 Cache 容量 的 许多 “区 段 ”, 相 应 地 把 主 存 地 址 也 划分 
为 访问 主 存 的 “区 段 "( 区 段 号 ) 和 区 段 内 一 个 字 ( 区 段 内 偏 移 ) 这 样 两 个 字段 ,而 在 Cache 的 
标志 字段 仅 写 人 主 存 地 址 的 区 段 号 (地 址 映像 )。 在 进行 主 存 读 写 时 ,就 可 以 用 完整 的 主 存 
地 址 访问 主 存 的 一 个 存储 单元 ,并 使 用 区 段 内 偏 移 这 一 字段 为 地 址 (地 址 变换 ) 访 问 Cache 
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的 一 个 单元 ,此 时 只 须 用 主 存 地 址 的 区 段 号 的 值 与 Cache 的 这 一 单元 的 标志 字段 的 内 容 比 
较 即 可 ,二 者 相同 且 有 效 标志 位 的 值 为 1, 表 明 Cache 的 有 
这 一 单元 的 数据 字段 的 内 容 即 为 被 读数 据 , 即 此 次 访问 管 cache | 
Cache 成 功 , 称 为 “命中 ”; 二 者 不 同时 , 则 表明 相应 主 存 标志 tt 主 
单元 内 容 尚 未 读 入 Cache, 是 “缺失 ”, 又 称 * 不 命中 ”。 图 一 十 数据 在 
Ts NS 
据 



































8.3 给 出 了 这 一 方案 的 示意 组 织 关 系 。 

3. 多 路 组 相 联 映像 方式 

多 路 组 相 联 映像 方式 是 对 全 相 联 映像 和 直接 映像 的 
一 种 折 中 的 处 理 方案 。 它 既 不 是 在 主 存 和 Cache 之 间 实 
现 字 块 ( 字 ) 的 完全 随意 对 应 ,也 不 是 在 主 存 和 Cache 之 间 
的 实现 字 块 ( 字 ) 的 多 对 一 的 硬性 对 应 ,而 是 实现 一 种 有 限 图 8.3 直接 映像 方式 
度 的 随意 对 应 。 例 如 ,一 个 主 存 字 块 可 以 与 Cache 中 的 2、 
4.8 个 单元 建立 对 应 关系 ,此 时 被 分 别称 为 2.4.8 路 组 相 联 。 它 的 实现 原理 简 述 如 下 。 

首先 ,把 Cache 存储 器 组 织 为 同等 容量 的 多 体 结构 ,例如 变 为 2.4、8 个 体 , 若 Cache 的 
总 容量 不 变 , 则 每 个 体 的 存储 单元 数 变 为 原来 单 体 容量 的 若干 分 之 一 。 每 个 Cache 体 的 一 
个 单元 都 可 以 和 一 个 主 存 字 ( 字 块 ) 的 内 容 相对 应 ,对 应 关系 与 直接 映像 类 似 , 仍 把 主 存 划分 
成 容量 等 于 每 个 Cache 体 的 存储 单元 数 的 多 个 “区 段 ", 相 应 地 把 主 存 地 址 也 划分 为 访问 主 
存 的 “区 段 ”"( 区 段 号 ) 和 区 段 内 一 个 字 块 (区 段 内 偏 移 ) 这 样 两 个 部 分 ,而 在 Cache 的 标志 字 
段 仅 保存 主 存 地 址 的 区 段 号 。 在 进行 主 存 读 写 时 ,就 可 以 用 完整 的 主 存 地 址 访问 主 存 一 个 
存储 单元 ,并 使 用 主 存 地 址 的 区 段 内 偏 移 这 一 字段 为 地 址 访问 每 个 Cache 体 的 一 个 单元 ,此 
时 只 需 用 主 存 地 址 的 区 段 号 的 值 同 时 与 每 个 Cache 体 选 中 的 一 个 单元 的 标志 字段 的 内 容 比 
较 , 若 与 其 中 任何 一 个 Cache 体 的 标志 字段 的 内 容 相 同 且 相应 有 效 位 的 值 为 1, 则 表明 存储 
于 这 一 Cache 体 中 的 这 一 数据 字段 的 内 容 即 为 被 读数 据 , 即 此 次 访问 Cache 命中 ;都 不 同 
时 , 则 表明 相应 主 存单 元 内 容 尚 未 读 入 Cache, 是 不 命中 。 

这 一 方案 与 直接 映像 方案 的 区 别 主要 表现 在 ,每 一 个 主 存 字 块 可 以 从 多 个 (例如 2、4、8 
个 ,而 不 再 是 一 个 ) 体 中 选择 其 一 完成 写 人 Cache 的 操作 ,有 了 更 大 程度 的 选择 余地 ,有 利于 提 
高 Cache 的 命中 率 。 当 用 主 存 地 址 的 区 段 号 与 Cache 中 的 标志 字段 比较 时 ,只 与 每 个 体 的 确 
定 的 一 个 存储 单元 的 标志 字段 相 比较 ,线路 上 实现 也 不 会 太 复杂 ,确保 这 一 方案 简便 易 行 。 
这 一 方案 与 全 相 联 映像 方案 的 类 同 之 处 主要 表现 在 .在 把 一 个 主 存 字 写 进 Cache 时 , 它 

可 以 在 Cache 的 多 个 (例如 2、4、8) 体 中 进行 选择 ， 











































































































有 
从 就 是 说 ,一 个 主 存 字 ( 字 块 ) 可 以 与 多 个 Cache 单元 
Ea 主 《由 每 个 Cache 存储 体 提供 一 个 ) 建 立 随 意 的 对 应 关 
入” 系 , 故 这 是 有 限度 地 随意 对 应 ,其 目的 是 尽量 简化 完 
比较 得 党 ”成 与 Cache 中 标志 字段 相 比较 的 线路 。 当 用 主 存 地 
H 址 的 区 段 号 与 Cache 中 的 标志 字段 比较 时 ,只 与 每 
比较 





标志 字段 相 比 较 , 线 路 上 实现 也 不 会 太 复杂 ,确保 这 
a 一 方案 简便 易 行 。 多 路 组 相 联 映像 是 性 能 最 好 的 一 
图 8.4 二 路 组 相 联 映像 方式 种 Cache 组 织 方式 。 这 一 方案 如 图 8.4 所 示 。 


重子 个 体 的 确定 的 一 个 存储 单元 (而 不 再 是 全 部 单元 ) 的 
下 
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设 主 存 地 址 为 bp 位 , 令 p 三 m 十 b, 主 存 的 字 块 总 数 为 2", 块 内 字 节 数 为 2 。Cache 的 地 
址 码 为 9 一 c 十 0 位 ,Cache 的 字 块 总 数 为 2“, 块 内 字 节 数 与 主 存 相同 。 令 j 为 Cache 字 块 号 ， 
i 为 主 存 字 块 号 。 图 8.5 就 3 种 映像 方式 主 存 地 址 的 划分 进行 一 个 简单 的 比较 ,同时 给 出 3 
种 映像 方式 的 地 址 映像 和 地 址 变换 。 




















主 存 地 址 划分 
标记 位 的 位 数 最 长 ， 为 m=r+e， 比 较 时 ， 
主 存 守 块 标记 | 字 屿 1 主 存 字 块 标记 需 与 Cache 全 部 单元 的 标记 
字段 比较 
位 位 
(a) 全 相 联 映像 方式 







记 i mod 2*， 标 记 位 的 位 数 明显 减少 ， 比 
较 时 ， 主 存 字 块 标记 只 与 Cache 的 一 个 单 
元 的 标记 字段 比较 





主 存 Cache 
字 块 标记 | 字 块 地 址 
! 位 < 位 5 位 





字 块 内 
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(b) 直接 映像 方式 

人 一 j=(i mod 2°)x2"+k(0<k<2"-1)， 标 记 位 
_ 走 存 | 组 地 址 | 字 块 内 全 加 于 位 ， 比较 时 ”名 与 Cache 的 5 个 
字 块 标记 地 址 单元 的 标记 字段 比较 











tr 位 cs=c-r 位 ”4b 位 


(0) 组 相 联 映像 方式 
图 8.5 3 种 映像 方式 的 比较 





8.1.3 Cache 实用 中 的 问题 


1. Cache 替换 算法 

Cache 中 的 块 比 主 存 中 的 块 要 少 得 多 ,前 面 我 们 介绍 的 3 种 映像 方式 ,都 表明 一 个 
Cache 块 可 以 对 应 多 块 主 存 块 。 因 此 , 当 新 的 一 个 主 存 块 需要 装 人 到 Cache 中 时 ,就 有 一 个 
将 哪个 Cache 块 替 换 出 去 的 问题 。 对 于 直接 映像 方式 ,一 个 主 存 块 仅 和 唯一 的 一 个 Cache 
块 对 应 ,也 就 不 存在 什么 选择 。 而 对 于 全 相 联 映像 方式 和 多 路 组 相 联 映像 方式 ,由 于 一 个 主 
存 块 可 以 装 入 到 不 同 的 Cache 块 中 ,就 需要 有 一 个 替换 算法 来 决定 将 哪 一 块 Cache 块 蔡 换 
出 去 。 为 保证 Cache 的 性 能 ,这 个 算法 还 应 该 用 硬件 实现 。 

迄今 为 止 , 已 经 使 用 了 多 个 蔡 换算 法 ,其 中 效果 最 好 的 应 该 是 最 近 最 少 使 用 法 (Least 
Recently Used,.LRU) . 即 蔡 换 出 组 内 没有 被 访问 时 间 最 长 的 一 个 Cache 块 。 对 两 路 组 相 联 
方式 ,这 个 算法 实现 起 来 十 分 简单 ,只 须 在 组 内 的 两 块 Cache 块 中 分 别 增加 一 个 使 用 位 , 初 
始 值 均 为 0。 当 某 块 中 的 内 容 被 访问 时 ,将 它 的 使 用 位 置 为 1, 而 将 另外 的 一 块 的 使 用 位 置 
为 0。 这样 , 当 有 新 的 主 存 块 要 装 入 到 这 个 组 时 ,只 需 将 使 用 位 为 0 的 那 块 替换 出 去 即 可 。 

除 LRU 法 外 ,常用 的 算法 还 有 先进 先 出 法 (First In First Out,FIFO) , 即 替换 出 最 先 装 
和 人 到 Cache 中 的 那个 主 存 块 ,这 可 以 用 一 个 循环 电路 来 实现 。 还 有 一 个 算法 是 最 少 使 用 法 
(Least Frequently Used,LFU) ,将 使 用 次 数 最 少 的 一 个 Cache 块 蔡 换 出 去 , 它 需 要 在 每 个 
Cache 块 上 加 一 个 计数 器 来 记录 CPU 对 其 的 访问 次 数 。 另 外 ,也 还 有 用 随机 替换 算法 随机 
找 一 块 替换 出 去 的 。 

2. 写 Cache 策略 

为 提高 系统 性 能 .CPU 主要 与 Cache 交换 数据 , 它 对 主 存 数据 的 更 改 , 首 先是 更 改 
Cache 中 的 内 容 , 为 保持 Cache 中 的 数据 与 主 存 中 数据 的 一 致 性 ,必然 也 要 更 改 其 对 应 的 主 
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存 中 的 数据 。 

现代 计算 机 中 ,能 够 访问 主 存 的 设备 已 经 不 止 一 个 。 通 常情 况 下 ,一 个 计算 机 系统 内 可 
能 有 多 个 CPU ,它们 可 以 有 各 自 的 Cache 和 公用 的 主 存 , 也 可 能 还 有 多 个 可 以 独立 进行 主 
存 读 写 的 设备 (此 时 称 它们 为 总 线 主 设备 (Bus Masters))。 当 任何 一 个 CPU 要 完成 写 
Cache/ 主 存 , 或 任何 一 个 设备 要 执行 读 主 存 或 写 主 存 操作 时 ,必须 保证 共享 这 些 有 关 主 存 
单元 的 CPU 和 总 线 主 设备 所 用 到 的 数据 都 是 合法 的 (数据 一 致 性 原则 ) 。 

例如 ,一 个 外 设 向 主 存 写 人 了 一 个 数据 ,而 该 主 存单 元 的 内 容 在 此 之 前 已 有 一 个 副本 在 
CPU 的 Cache 中 ,此 时 ,该 主 存单 元 内 容 与 它 在 Cache 中 的 副本 就 出 现 了 不 一 致 ,怎么 办 
呢 ? 此 时 最 简便 的 办 法 ,就 是 把 相应 Cache 单元 中 的 有 效 位 清 掉 , 当 CPU 再 次 需要 读 这 一 
主 存单 元 时 , 它 只 能 从 主 存 中 重新 取得 被 外 设 修改 过 的 新 值 ,而 不 会 使 用 原 Cache 中 过 时 的 
旧 值 。 又 如 , 当 CPU 向 自己 的 一 个 Cache 单元 中 写 入 一 个 新 值 ,但 尚未 修改 与 之 相应 的 主 
存单 元 的 内 容 时 ,也 出 现 了 二 者 间 数 据 不 一 致 性 的 问题 ,该 怎样 处 理 呢 ? 常用 的 策略 有 写 直 
达 和 拖 后 写 两 种 。 

第 一 种 策略 是 写 完 Cache 之 后 ,立即 修改 主 存 , 称 为 写 直 达 (Write Through) ,其 优点 是 
处 理 简单 ,数据 一 致 性 容易 保证 。 其 缺点 是 ,配置 Cache 对 写 操作 来 说 ,非但 没有 提高 性 能 ， 
甚至 会 降低 系统 的 速度 。 更 糟 的 情况 也 许 会 发 生 , 在 没有 其 他 CPU、 外 设 去 读 这 些 被 重 写 
过 的 主 存单 元 时 ,这 些 写 主 存 的 操作 是 徒劳 无 功 的 , 它 只 起 到 了 减 慢 系 统 速度 的 作用 。 

第 二 种 策略 是 写 完 Cache 之 后 ,不 直接 去 改写 相应 的 主 存单 元 的 内 容 , 但 把 这 些 主 存单 
元 的 地 址 登记 到 Cache 控制 器 中 的 一 张 列表 中 , 若 有 另外 的 CPU 或 外 设 发 出 读 主 存 的 请 
求 ,并 将 主 存 地 址 送 到 地 址 总 线 之 上 时 ,首先 将 它们 要 读 的 地 址 与 原来 保存 在 Cache 的 那 张 
列表 中 的 全 部 地 址 内 容 ( 可 能 多 条 ) 相 比较 ,这 一 操作 称 为 总 线 监听 。 若 比较 的 结果 都 不 同 ， 
表明 本 次 的 读 请 求 使 用 的 不 是 那些 尚 待 修改 内 容 的 主 存单 元 , 则 只 需 继续 完成 本 次 读 操作 
即 可 ; 若 与 列表 中 的 某 一 个 地 址 相同 , 则 表明 本 次 读 的 主 存单 元 目前 保存 的 是 一 个 无 效 (等 
待 修改 ) 的 数据 ,不 能 允许 读 操作 进行 ,需要 首先 发 出 命令 停止 该 读 操作 ,再 把 保存 在 Cache 
单元 中 的 正确 数据 ,通过 一 个 写 主 存 周 期 将 其 写 入 相应 的 主 存单 元 , 接 下 来 再 启动 刚 停 下 来 
的 读 操 作 , 则 CPU 或 外 设 读 得 的 一 定 是 正确 的 数据 。 这 一 策略 的 优点 是 明显 的 , 它 确保 每 
一 次 写 主 存 都 是 必须 完成 的 那 一 部 分 .而 不 全 出 现 徒劳 的 写 操作 ,系统 性 能 高 。 这 种 策略 称 
为 拖 后 写 (Write Back)。 其 缺点 是 实现 上 比较 复杂 .成 本 较 高 。 

3. Cache 的 命中 率 

Cache 的 命中 率 是 Cache 最 重要 的 属性 ,提高 Cache 的 命中 率 是 存储 器 系统 设计 者 的 
目标 。 影 响 Cache 命中 率 的 因素 有 很 多 .包括 Cache 的 容量 .Cache 块 的 大 小 .Cache 的 组 织 
方式 及 Cache 的 数量 等 。 

一 般 来 说 ,因为 可 以 同时 在 Cache 中 存放 有 更 多 的 内 容 , 增 加 Cache 的 容量 显然 可 以 提 
高 Cache 的 命中 率 .命中 率 与 Cache 容量 的 关系 可 以 用 图 8. 6 来 表示 。 可 以 看 出 , 随 着 
Cache 容量 增 大 到 一 定 的 程度 ,再 增加 容量 对 提高 命中 率 的 效果 就 不 大 了 。 而 由 于 组 成 
Cache 必须 是 价格 昂贵 的 SRAM., 所 以 .从 性 能 /价格 比 考虑 ,Cache 容量 一 般 应 控制 在 合理 
的 范围 内 。 

Cache 与 主 存 交 换 数 据 是 以 块 为 单位 的 . 当 CPU 要 装 人 一 个 主 存 字 到 Cache 内 时 ,不 
仅仅 是 装 入 它 需 要 的 这 一 个 字 , 而 是 包括 与 之 相 邻 的 其 他 字 的 整个 主 存 块 。 当 Cache 块 的 
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图 8.6 Cache 命中 率 和 容量 的 关系 





大 小 增加 时 ,每 次 交换 的 数据 量 增加 ,根据 程序 局 部 性 原理 ,命中 率 应 该 会 增加 。 当 然 ， 
Cache 块 的 大 小 也 不 是 越 大 越 好 ,大 的 Cache 块 每 次 和 主 存 进行 数据 交换 时 需要 的 时 间 也 
长 ,而 且 , 装 入 Cache 的 内 容 也 许 是 CPU 近期 不 需要 的 数据 ,可 能 会 造成 不 必要 的 数据 装 
入 ,影响 系统 的 性 能 。 一 般 来 说 ,Cache 块 的 容量 在 4 一 32 个 字 节 范围 之 间 比 较 适 宜 。 

Cache 的 组 织 结构 也 会 影响 Cache 的 命中 率 。 显 然 , 直接 映像 方式 的 命中 率 会 比较 低 ， 
而 全 相 联 映像 方式 的 命中 率 比 较 高 。 但 从 性 能 /价格 比 综合 考虑 ,最 合适 的 组 织 方式 应 该 是 
两 路 或 四 路 组 相 联 方式 。 

Cache 刚 出 现时 ,系统 中 一 般 只 有 一 个 Cache。 目 前 ,多 Cache 的 计算 机 系统 已 经 很 普 
遍 了 。 通 常 的 方法 是 在 已 有 的 Cache 存储 器 系统 之 外 ,再 增加 一 个 容量 更 大 的 Cache。 此 
时 原 有 Cache 为 第 一 级 Cache( 例 如 奔腾 微 处 理 机 芯片 内 的 Cache) ,新 增加 的 Cache 则 成 为 
第 二 级 的 Cache。 这 两 级 Cache 的 关系 中 ,第 二 级 Cache 的 容量 比 第 一 级 Cache 的 容量 要 
大 得 多 ,在 第 一 级 Cache 中 保存 的 信息 也 一 定 保存 在 第 二 级 Cache 中 (多 级 存储 器 系统 中 的 
包含 性 原则 ) ,但 保存 有 比 第 一 级 Cache 中 更 多 的 信息 。 当 CPU 访问 第 一 级 Cache 出 现 缺 
失 情 况 时 ,就 去 访问 第 二 级 Cache。 依 此 思路 .也 可 以 再 增加 第 三 级 Cache。 若 第 一 级 .第 二 
级 Cache 的 命中 率 为 90% , 则 它们 合 起 来 之 后 的 命中 率 将 为 1 一 (1 一 90%)X (1 一 90%) 
99% ,而 不 会 是 81%。 

4。Cache 的 接 入 法 

如 何 把 Cache 接 入 计算 机 的 系统 ,也 是 值得 认真 解决 的 问题 ,常用 的 接 入 Cache 的 方法 
有 以 下 两 种 ,如 图 8.7 所 示 。 
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(a) Look-aside Cache Architecture (b) Look-through Cache Architecture 
图 8.7 Cache 接 入 系统 的 方法 
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第 一 种 方法 是 把 Cache 系统 如 同一 个 接口 卡 一 样 的 接 到 计算 机 主 总 线 上 , 称 为 Look- 
aside Cache Architecture, 如 图 8.6(a) 所 示 。 这 一 结构 的 优点 是 实现 简单 .成 本 低 ;其 缺点 
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是 , 当 CPU 与 Cache 交换 信息 时 , 它 占 用 了 总 线 , 使 接 在 总 线 上 的 其 他 Bus Masters 不 能 与 
主 存 交 换 信息 。 

第 二 种 方法 是 把 原来 的 处 理 机 总 线 “ 打 断 ”, 用 Cache 把 原来 的 总 线 隔 断 为 两 个 部 分 , 称 
为 Look-through Cache Architecture, 如 图 8.6(b) 所 示 。 它 的 优点 是 提高 了 总 线 上 并 发 操 
作 的 可 能 性 , 即 当 CPU 与 Cache 交换 信息 时 .Bus Master 可 以 同时 与 主 存 交 换 信息 ,有 利 
于 提高 计算 机 整体 性 能 。 其 缺点 是 设计 复杂 ,实现 成 本 较 高 ,而 且 在 读 Cache 不 命中 的 情况 
下 , 读 主 存 用 的 时 间 会 更 多 一 点 , 它 在 读 Cache 失败 之 后 才 启 动 读 主 存 。 


8.2 虚拟 存储 器 


8.2.1 虚拟 存储 器 的 概念 介绍 


虚拟 存储 器 通常 是 指 高 速 磁盘 上 的 一 片 存储 空间 ,其 功能 是 通过 硬件 .软件 的 办 法 ,可 
以 将 其 作为 主 存储 器 的 扩展 的 存储 空间 一 样 来 使 用 ,这 就 使 得 程序 设计 人 员 能 够 使 用 比 主 
存储 器 实际 容量 大 得 多 的 存储 空间 来 设计 和 运行 程序 。 这 里 讨论 的 是 在 " 主 存 一 辅 存 ”层次 
遇 到 的 问题 。 众 所 周知 , 主 存储 器 的 容量 一 直 是 影响 计算 机 性 能 的 关键 因素 ,人 们 又 不 想 通 
过 花 太 多 的 钱 ,无 节制 地 扩大 主 存储 器 实际 容量 ,出 路 何在 呢 ? 根据 程序 运行 的 局 部 性 原 
理 , 一 个 程序 运行 时 ,在 一 小 段 时 间 内 ,只 会 用 到 程序 和 数据 的 一 小 部 分 , 仅 把 这 部 分 程序 和 
数据 装 人 主 存储 器 即 可 ,更 多 的 部 分 可 以 在 用 到 时 随时 从 磁盘 调和 人 主 存储 器 ,这 就 是 提出 虚 
拟 存储 器 的 核心 思路 。 

虚拟 存储 器 所 追求 的 目标 是 摆脱 主 存储 器 容量 的 限制 (通过 磁盘 非常 大 的 存储 空间 解 
决 ) ,降低 存储 一 定 信息 所 用 的 成 本 (通过 磁盘 非常 低 的 存储 成 本 解决 )。 问 题 是 应 该 如 何 实 
现 一 个 程序 和 相关 数据 在 磁盘 和 主 存储 器 之 间 交 换 ;如 何 划分 磁盘 和 主 存储 器 的 区 域 ; 如 何 
管理 ( 何 时 、 何 种 策略 、 每 次 交换 信息 的 单位 量 ) 二 者 之 间 的 信息 交换 ;要 增加 一 些 什么 硬件 
和 软件 组 成 ,这 些 就 是 我 们 将 在 本 节 讲 解 虚拟 存储 器 过 程 中 要 讨论 的 问题 。 要 指出 ,虚拟 存 
储 器 的 有 关 知 识 不 是 计算 机 组 成 原理 课 的 重点 内 容 , 在 计算 机 系统 结构 ,操作 系统 两 门 课程 
中 将 有 更 详细 、 系 统 的 说 明 。 我 们 这 里 只 简明 扼要 地 介绍 虚拟 存储 器 中 的 段 式 存储 管理 和 
页 式 存储 管理 的 基本 概念 和 原理 性 知识 。 


8.2.2 段 式 存储 管理 


从 程序 设计 和 存储 器 管理 的 角度 看 , 段 这 个 词 有 特定 的 含义 。 段 是 模块 化 程序 设计 的 
产物 ,在 程序 设计 过 程 中 ,通常 会 把 在 逻辑 上 、 处 理 功能 上 有 一 定 独立 性 的 程序 段落 单独 划 
分 成 一 个 独立 的 程序 单位 , 供 主 程序 或 其 他 程序 部 分 调用 ,一 个 大 的 程序 是 由 许多 程序 单位 
经 过 连接 组 成 的 。 此 时 的 每 个 程序 单位 就 是 一 个 程序 段 ,可 以 用 段 名 或 段 号 来 指明 程序 段 ， 
每 个 段 的 长 度 是 随意 的 ,由 组 成 程序 段 的 指令 条 数 决定 ,或 由 组 成 数据 段 的 数据 数目 决定 。 
在 处 理 和 运行 这 样 的 程序 时 ,把 段 作为 信息 单位 ,实现 在 主 存 一 辅 存 之 间 传 送 和 定位 是 合理 
的 。 为 此 ,必须 把 主 存 按 段 进行 分 配 与 管理 ,这 种 管理 方式 被 称 为 段 式 存储 管理 。 

经 过 连接 而 组 成 的 程序 所 占用 的 空间 被 称 为 程序 的 逻辑 空间 。 在 指令 中 ,一 个 逻辑 地 
址 由 逻辑 段 号 拼接 上 段 内 地 址 组 成 (每 段 内 的 第 一 个 字 的 段 内 地 址 均 默 认为 0)。 在 程序 运 
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行 过 程 中 , 当 用 到 某 一 段 并 将 其 调 入 主 存 时 , 它 被 分 配 在 一 片 连续 的 主 存 区 域 , 该 主 存 区 域 
的 起 始 单元 用 于 存放 该 段 的 第 一 个 字 , 以 后 各 字 均 依次 顺序 存放 。 图 8. 8 给 出 了 由 3 段 组 
成 的 一 个 程序 的 逻辑 地 址 空间 ,其 中 两 段 已 装 入 主 存 的 示意 表示 。 

由 此 可 见 , 段 式 存储 管理 的 核心 问题 是 变 逻 辑 地 址 中 的 逻辑 段 号 为 主 存 中 的 一 个 存储 
区 域 的 起 始 地 址 ,这 是 通过 在 系统 中 设置 一 个 段 表 完 成 的 。 段 表 也 是 一 个 特定 的 段 ,通常 被 
保存 在 主 存 中 。 为 访问 段 表 , 段 表 在 主 存 中 的 起 始 地 址 被 写 人 到 一 个 被 称 为 段 表 基地 址 寄 
存 器 的 专用 的 寄存 器 中 。 段 表 由 多 个 人 口 ( 表 项 ) 组 成 ,每 个 表 项 由 3 部 分 内 容 构成 : 段 起 
始 地址 、 段 的 长 度 和 段 的 装 和 人 位 。 段 起 始 地 址 给 出 的 是 本 段 在 主 存 中 的 起 始 地 址 ,该 起 始 地 
址 加 上 段 内 地 址 就 得 到 本 段 的 一 个 字 在 主 存 中 的 真正 地 址 。 段 的 长 度 用 于 主 存 使 用 的 合法 
性 检查 , 当 出 现 段 内 地 址 超过 段 的 长 度 时 ,就 是 主 存 使 用 中 的 一 个 地 址 越界 错误 。 段 的 装 入 
位 用 于 判断 本 段 是 否 已 装 入 主 存 。 图 8. 9 给 出 了 由 逻辑 地 址 到 主 存 实际 地 址 的 转换 过 程 。 





































































































表 基 地 址 | 。 | 自 呈 | 段 内 地 址 | 逻辑 地 址 
l 段 表 | 基地 址 寄存 器 | 
段 2 段 1 
[上 一 | [ET 0 
= 人 
程序 的 逻辑 地 址 空间 一 [Er 
| | 广 一 | 
ER | 
主 存储 器 装 入 位 
图 8.8 逻辑 地 址 与 主 存 占用 示意 表示 图 8.9 逻辑 地 址 到 主 存 实际 地 址 的 转换 
地 址 转换 过 程 从 概念 上 讲 可 以 用 如 下 办 法 完成 : 把 逻辑 地 址 中 的 段 号 取 来 与 段 表 基地 





址 的 内 容 相 加 ,用 相 加 之 和 做 地 址 ,找到 段 表 的 一 个 表 项 ,检查 该 表 项 中 的 装 入 位 ,其 内 容 为 
1 ,表示 该 段 已 调和 人 主 存 , 从 表 项 中 取 段 的 起 始 地 址 与 逻辑 地 址 中 的 段 内 地 址 相 加 ,就 得 到 一 
个 数据 在 主 存 中 的 实际 地 址 。 若 表 项 中 的 装 和 人 位 的 值 为 0, 表 示 该 段 尚 未 调 入 主 存 , 则 操作 
系统 负责 首先 把 该 段 从 磁盘 装 入 主 存 , 并 相应 修改 段 表 中 的 该 表 项 内 容 , 之 后 才 可 以 完成 地 
址 转换 过 程 。 实 际 实现 中 ,还 会 设立 一 个 段 地 址 寄存 器 , 当 一 段 刚 投入 运行 过 程 时 ,完成 前 
述 操作 之 后 ,会 把 这 一 段 在 主 存 中 的 起 始 地 址 首先 写 人 段 地 址 寄存 器 ,在 该 段 其 后 的 运行 过 
程 中 ,就 不 必 再 查 段 表 , 而 用 段 地 址 寄存 器 的 内 容 直 接 与 段 内 地 址 相 加 ,以 便 快速 地 得 到 一 
个 数据 在 主 存 中 的 实际 地 址 ,从 而 提高 系统 的 运行 性 能 。 

段 式 存储 器 管理 的 优点 是 明显 的 。 首 先 , 段 的 分 界 与 程序 的 自然 分 界 相对 应 。 其 次 , 段 
逻辑 上 的 独立 性 使 其 易于 分 别 编译 .管理 ,修改 和 保护 ,也 便于 多 道 程序 实现 对 段 的 共享 。 
但 段 长 的 不 确定 性 ,会 给 主 存 空 间 的 分 配 与 管理 带 来 麻烦 ,而 且 容 易 造成 在 段 间 留 下 许多 零 
碎 的 ,难以 使 用 的 小 的 存储 空间 ( 称 为 碎 块 ) ,浪费 存储 器 的 有 效 可 用 容量 ,假若 碎 块 太 多 ,其 
至 会 使 整个 存储 器 都 难以 利用 。 


8.2.3 页 式 存储 管理 


页 式 存储 管理 是 男 一 种 经 常用 到 的 虚拟 存储 器 管理 技术 。 它 的 主要 思路 是 把 虚拟 ( 逻 
辑 ) 地 址 空间 和 主 存 实际 (物理 ) 地 址 空间 都 分 成 容量 大 小 相等 的 页 ,并 规定 页 的 大 小 为 2 的 
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整数 次 方 个 字 , 则 所 有 地 址 都 可 以 用 页 号 拼接 页 内 地 址 的 形式 来 表示 。 虚 拟 地 址 用 虚 页 号 
拼接 页 内 地 址 给 出 , 主 存 实际 地 址 用 实 页 号 拼接 页 内 地 址 给 出 。 请 注意 ,页 式 存 储 管理 与 段 
式 存储 管理 的 一 个 重要 区 别 , 段 本 身 是 程序 设计 的 一 个 产物 , 段 是 一 个 独立 的 程序 单位 ,长 
度 可 变 ; 而 页 则 不 是 程序 本 身 的 特性 ,是 为 了 方便 管理 ,人 为 地 对 程序 进行 划分 的 结果 ,通常 
在 一 个 计算 机 系统 中 ,页 的 长 度 是 事先 确定 的 ,不 会 变化 。 这 种 通过 分 页 方式 进行 的 存储 器 
管理 被 称 为 页 式 存储 器 管理 。 它 的 关键 功能 是 实现 以 页 为 单位 来 完成 在 虚 存 和 主 存 之 间 信 
息 交换 ,并 完成 逻辑 地 址 到 物理 地 址 的 转换 。 说 到 底 就 是 找 出 虚 页 号 和 实 页 号 的 对 应 关系 。 
这 可 以 通过 设立 页 表 来 完成 。 

页 表 由 若干 表 项 组 成 ,每 个 虚 页 号 对 应 页 表 中 的 一 个 表 项 , 表 项 的 内 容 可 以 由 如 下 一 些 
部 分 组 成 。 最 重要 的 是 一 个 虚 页 分 配 在 主 存 中 的 实际 页 号 ,还 可 能 包括 页 装 入 (有 效 ) 位 , 修 
改 标记 位 ,替换 控制 位 ,其 他 保护 位 等 组 成 的 控制 位 字段 。 请 注意 ,在 页 式 存储 器 管理 的 系 
统 中 ,页 表 本 身 也 是 以 页 为 单位 管理 的 ,可 以 保存 在 虚 存 中 ,也 可 以 保存 在 主 存 中 ,为 了 能 到 
主 存 中 找到 页 表 , 必 须 设 立 一 个 专用 的 页 表 基 地 址 寄存 器 。 图 8. 10 给 出 了 页 式 存储 器 管理 
的 地 址 变换 过 程 。 









































页 表 基 地 址 寄存 器 虚 地 址 
页 表 基地 址 虚 页 号 | ”页 内 地 址 
控制 位 字段 _ 实 页 号 
实 页 号 | 页 内 地 址 
1 
| J 实 存 地 址 
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图 8.10 页 式 存储 器 管理 的 地 址 变换 过 程 








这 一 地 址 变换 过 程 是 : 用 虚 地 址 中 的 虚 页 号 与 页 表 基 地 址 相 加 , 求 出 对 应 该 虚 页 的 页 
表 表 项 在 主 存 中 的 实际 地 址 ,从 该 表 项 的 实 页 号 字段 取出 实 页 号 再 拼 上 虚 地 址 中 的 页 内 地 
址 ,就 得 到 读 主 存 数据 用 的 实际 地 址 。 

当 需 要 把 一 页 从 虚 存 内 容 调和 人 主 存 时 ,操作 系统 从 主 存储 器 的 空闲 区 找 出 一 页 分 配给 
这 一 页 ,把 该 页 的 内 容 写 人 主 存 , 把 主 存储 器 的 实际 页 号 写 进 页 表 的 相应 表 项 的 实 页 号 字 
段 , 写 装 和 位 为 1。 

当下 次 要 读 该 页 内 的 某 个 存储 单元 时 ,首先 要 读 一 次 主 存 ,通过 查 页 表 求 出 实 存 地 址 ， 
然后 再 读 一 次 主 存 , 才 能 取得 要 读 的 数据 ,为 读 一 个 数据 变 成 两 次 读 主 存 ,实际 应 用 中 是 难 
以 令 人 接受 的 。 怎 么 解决 这 一 问题 呢 ? 答案 是 设立 一 个 完全 用 快速 硬件 实现 的 容量 很 小 的 
(一 般 在 16 一 64 个 表 项 之 间 ) 快 速 页 表 ( 英 文 为 Translation Lookaside Buffer,.TLB) .用 于 
存放 在 页 表 中 使 用 最 频繁 的 .为数 不 多 的 那些 表 项 的 内 容 。 它 的 最 重要 的 两 项 内 容 是 虚 页 
号 和 实 页 号 ,如 图 8. 11 所 示 。 经 快速 页 表 实 现 的 地 址 转换 过 程 ,用 虚 地 址 中 的 虚 页 号 去 与 
快速 页 表 中 虚 页 号 字段 的 内 容 相 比较 ,与 哪个 表 项 中 的 虚 页 号 相同 , 则 可 以 取出 该 表 项 中 的 
实 页 号 ,并 与 页 内 地 址 拼接 出 主 存 实际 地 址 。 这 一 过 程 可 以 很 快 完成 ,很 类 似 于 高 速 缓冲 存 
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储 器 的 运行 原理 。 当 在 快速 页 表 中 找 不 到 该 虚 页 号 时 ,就 要 到 主 存 中 经 慢 表 找 出 该 虚 页 号 
对 应 的 实 页 号 ,在 得 到 一 个 主 存 实 际 地 址 的 同时 ,并 用 该 虚 页 号 和 实 页 号 蔡 换 快速 页 表 的 一 
个 表 项 的 内 容 , 以 反映 这 次 操作 的 现实 形势 。 

































































































































































虚 地 址 (程序 中 给 出 ) 
虑 地 址 (程序 中 给 出 ) 页 内 地 址 
康 页 号 | 页 内 地 址 
实地 址 介 ( 谈 写 内 存 用 ) 
实地 址 个 ( 读 写 内 存 用 ) 实 页 号 | 页 内 地 坦 
实 页 号 | 页 内 地 址 上 
度 页 本 | 实 页 可 | | 庶 页 号 实 页 号 
- [a 
比 税 ( 按 内 容光 ) (在 内 存 中 ) 控制 位 有 效 位 快 表 ( 专 设 硬件 ) 
人 快速 责 表 ( 专 设 硬件 ) 示 意 运行 过 各 (b) 经 页 表 和 快速 页 表 完 成 的 地 址 变换 


图 8.11 页 式 存储 器 管理 中 经 快速 页 表 实 现 的 地 址 变换 


本 章 内 容 小 结 和 学 习 方 法 建议 


在 简单 介绍 高 速 缓冲 存储 器 的 功能 和 基本 运行 原理 的 基础 上 ,重点 讲解 了 Cache 的 全 
相 联 映像 ,直接 映像 和 多 路 组 相 联 映 像 3 种 构成 方式 ,比较 它们 的 优 缺 点 ,讨论 了 提高 高 速 
缓冲 存储 器 命中 率 的 一 些 措施 。 在 介绍 虚拟 存储 器 的 功能 和 概念 的 基础 上 , 仅 就 段 式 和 页 
式 两 种 管理 方案 ,强调 虚拟 存储 器 的 硬件 组 成 和 把 逻辑 地 址 转换 为 内 存 实际 地 址 的 办 法 。 
本 章 内 容 强调 基本 原理 和 概念 ,没有 特别 关注 具体 例子 和 实用 等 方面 的 问题 。 


习题 与 思考 题 


1. 高 速 缓冲 存储 器 在 计算 机 系统 中 的 主要 作用 是 什么 ” 用 什么 类 型 的 存储 器 芯片 实 
现 ? 为 什么 ? 高 速 缓存 与 主 存在 读 写 原 理 方面 有 何 区 别 ? 

2 高速 缓 冲 存储 器 有 了 哪 3 种 主要 的 映像 方式 ”从 地 址 映射 和 地 址 变换 比较 它们 各 自 
的 特点 。 

3. 当主 存 或 高 速 缓存 某 单元 被 改写 后 ,通常 是 如 何 保 证 二 者 间 的 数据 一 致 性 原则 的 ? 
不 同方 案 的 优 缺点 各 是 什么 ?” 从 中 是 否 进一步 认识 到 在 多 级 结构 的 存储 器 系统 中 ,保证 数 
据 一 致 性 原则 的 重要 性 ? 

4. 说 明 影 响 高 速 缓存 命中 率 的 因素 都 有 哪 一 些 , 并 简单 解释 一 下 是 如 何 影 响 的 。 

5. 高 速 缓存 与 主 存 通常 只 以 字 为 单位 交换 信息 吗 ? 为 什么 ? 若 以 几 个 字 为 单位 交换 ， 
CPU ,总 线 与 主 存 应 提供 什么 支持 ? 

6. 使 用 多 级 高 速 缓存 的 目的 是 什么 ? 

7. 虚拟 存储 器 是 个 什么 概念 ? 它 的 存储 介质 是 什么 ? 虚拟 存储 器 要 解决 的 是 什么 
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问题 ? 

8. 虚拟 存储 器 要 求 有 什么 硬件 与 软件 支持 ?” 段 式 存储 管理 与 页 式 存储 管理 的 区 别 表 
现在 哪些 方面 ? 段 式 存储 为 什么 会 在 内 存储 器 中 形成 “ 碎 块 ”? 

9. 说 明 段 表 的 组 成 与 逻辑 段 地 址 到 内 存 实际 地 址 的 变换 过 程 。 

10. 说 明 页 表 的 组 成 与 程序 逻辑 地 址 到 内 存 物 理 地 址 的 变换 过 程 。 快 速 页 表 是 一 定 要 
有 的 吗 ? 说 明快 速 页 表 内 容 的 组 成 与 读 写 原理 。 

11. 假设 某 计 算 机 的 存储 器 系统 由 Cache 和 主 存 组 成 。 某 程序 执行 过 程 中 访 存 1000 
次 ,其 中 访问 Cache 缺失 (未 命中 )50 次 , 则 Cache 的 命中 率 是 

A. 5% B. 9.5% C. 50% D. 95% 

12. 某 计 算 机 的 Cache 共有 16 块 , 采 用 2 路 组 相 联 映像 方式 ( 即 每 组 两 块 ), 每 个 主 存 
块 大 小 为 32 字 节 , 按 字 节 寻 址 , 主 存 129 号 单元 所 在 主 存 块 应 装 入 到 的 Cache 组 号 
是 





A. 0 B.2 (BE D. 6 
13. 下 列 命令 组 合 情 况 中 ,一 次 访 存 过 程 中 不 可 能 发 生 的 是 __。 
A. TLB 未 命中 ,Cache 未 命中 ,Page 未 命中 
B. TLB 未 命中 ,Cache 命中 ,Page 命中 
C. TLB 命中 ,Cache 未 命中 ,Page 命中 
D. TLB 命中 ,Cache 命中 ,Page 未 命中 
14. 已 知 某 计算 机 系统 共有 4KB Cache, 采 用 多 路 组 相 联 映像 方式 ,分 为 32 组 ,每 组 有 
4 个 Cache 块 。 其 地 址 长 32 位 ,最 小 编 址 单位 为 字 节 。 
(1) 若 不 考虑 用 于 Cache 一 致 性 维护 和 替换 算法 的 控制 位 , 则 Cache 的 总 容量 为 多 少 ? 
(2) 内 存 地 址 000010AFH 将 映射 到 Cache 中 的 哪 一 组 (从 0 开始 编号 )? 
(3) 若 内 存 地 址 000010AFH 和 FFFF7xyBH 可 以 同时 被 映射 到 Cache 中 的 同一 组 , 那 
么 zy 可 能 的 取 值 为 多 少 ? 
15. 某 计 算 机 的 主 存 地 址 空间 大 小 为 256MB, 按 字 节 编 址 。 指 令 Cache 和 数据 Cache 
分 离 , 均 有 8 个 Cache 行 .每 个 Cache 行 大 小 为 64B, 数 据 Cache 采用 直接 映像 方式 。 现 有 
两 个 功能 相同 的 程序 A 和 B. 其 伪 代 码 如 下 所 示 。 


程序 a: 
int a[256] [256]; 


程序 B: 
int al[256] [256]; 
int sum arrayl() int sum array2() 
{ int i,j,sm=0; { int i,j,sm=0; 
for (0;j< 256?j++) 
for ( 这 0;i<256; 计 +) 


for (i=0;i< 256;it+) 
for (j=0;j<256;j++) 
sumt =a[i] D]; 
retum sum; 
} 


假定 int 类 型 数据 用 32 位 补 码 表示 ,程序 编译 时 i,j,sum 均 分 配 在 寄存 器 中 ,数组 a 按 
行 优先 方式 存放 ,其 首 地 址 为 320( 十 进 制 数 )。 请 回答 下 列 问题 ,要 求 说 明理 由 或 给 出 计算 


sumt =a[li] G]; 
retum sum; 
} 











高 迷 缓 阔 疗 入 器 和 永 拟 疗 储 器 





过 程 。 

(1) 若 不 考虑 用 于 Cache 一 致 性 维护 和 替换 算法 的 控制 位 , 则 数据 Cache 的 总 容量 ; 
多 少 ? 

(2) 数组 元 素 a[0] [31] 和 a[1] [1] 各 自 所 在 的 主 存 块 对 应 的 Cache 行 号 分 别 是 多 少 ? 
(Cache 行 号 从 0 开始 ) 

(3) 程序 A 和 B 的 数据 访问 命中 率 各 是 多 少 ” 哪 个 程序 的 执行 时 间 更 短 ? 
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二 
外 部 存储 器 设备 


本 章 主要 介绍 的 是 磁盘 .光盘 等 外 部 存储 器 (简称 外 存 )。 当 高 速 磁盘 以 虚拟 存储 器 的 
面貌 出 现时 ,人 们 更 喜欢 称 其 为 辅助 存储 器 。 外 存 设备 更 多 的 是 强调 它们 的 如 下 特性 : 设 
备 的 存储 容量 大 、 存 储 成 本 低 ,特别 是 在 断 电 后 仍 能 长 期 保存 信息 ,大 部 分 存储 介质 还 能 脱 
机 保存 信息 。 本 章 内 容 属于 一 般 了 解 的 部 分 比较 多 ,例如 磁 表 面 存储 器 的 读 写 原理 ,相关 设 
备 的 一 般 组 成 等 ;属于 应 该 掌握 的 内 容 不 是 很 多 ,主要 是 磁 记 录 编 码 ,磁盘 、 光 盘 简 单 组 成 与 
读 写 原理 ,磁盘 阵列 与 容错 技术 等 概念 性 知识 。 


9.1 外 存 设 备 概 述 


9.1.1 主要 技术 指标 


(1) 存储 密度 。 在 存储 介质 的 单位 长 度 上 或 单位 面积 上 所 存储 的 二 进 制 信息 的 数量 。 
对 于 磁盘 设备 ,通常 用 道 密度 和 位 密度 表示 ,也 可 以 用 二 者 的 乘积 表示 。 对 磁带 设备 ,通常 
总 是 用 位 密度 表示 。 

(2) 存储 容量 。 一 台 设 备 所 能 存储 的 总 信息 数量 ,通常 以 字 节 为 单位 表示 。 

(3) 寻 址 时 间 。 磁 盘 设 备 属于 按 直接 存 取 方 式 读 写 的 设备 , 它 的 寻 址 时 间 由 两 部 分 组 
成 ,一 是 磁头 沿 磁盘 的 径 向 运动 到 目标 磁道 的 时 间 ; 二 是 在 目标 磁道 上 等 待 磁盘 被 读 写 区 段 
旋转 到 磁头 下 面 的 时 间 。 由 于 这 两 个 时 间 都 与 当时 磁头 距离 目标 位 置 的 远近 有 关 , 故 习惯 
上 都 用 这 两 个 时 间 各 自 的 最 大 与 最 小 时 间 的 平均 时 间 之 和 来 表示 。 当 前 的 磁盘 ,该 值 为 几 
个 毫秒 到 十 几 个 毫秒 ;磁盘 本 身 的 读 写 速度 相对 较 快 。 磁 带 设备 是 以 顺序 存 取 方 式 完成 读 
写 , 不 存在 寻找 磁道 的 问题 ,但 要 读 写 磁带 某 个 区 域 上 的 信息 ,必须 首先 等 待 磁 带 旋 转 到 该 
区 域 , 其 所 用 的 时 间 , 可 能 是 几 分 钟 到 十 几 分 钟 , 时 间 会 比较 长 :磁带 本 身 的 读 写 速度 也 要 慢 
一 些 
(4) 数据 传输 率 。 指 磁 表 面 存储 器 在 单位 时 间 内 可 以 向 主机 传送 数据 的 数量 ,通常 用 
二 进 制 数 的 位 数 或 字 节 数 表示 。 它 与 设备 本 身 的 读 写 速度 和 接口 逻辑 线路 有 关 。 
(5) 误 码 率 。 外 存 设备 是 高 精密 度 的 机 械 电子 装置 , 集 机 械 、 电 子 、 电 磁 、 光 电 等 多 项 技 
术 于 一 身 ,不 仅 价格 较 高 ,其 运行 的 可 靠 性 也 远 比 CPU . 主 存 等 电子 逻辑 部 件 要 低 。 误 码 率 
就 是 用 于 衡量 磁 表 面 设备 运行 可 靠 性 的 重要 指标 , 它 等 于 在 一 次 读 操 作 过 程 中 ,出 错 信 息 数 
量 在 读 出 的 全 部 信息 中 所 占 的 比例 。 
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9.1.2 磁 记 录 原 理 与 记录 方式 


1. 磁 记 录 原 理 
磁 表 面 记录 设备 是 在 磁头 和 磁性 材料 的 记录 介质 之 间 有 相对 运动 时 ,通过 一 个 电磁 转 

换 过 程 完成 读 写 操作 的 。 图 9. 1 给 出 了 磁头 结构 和 电磁 转换 的 示意 图 。 
后 间隙 


磁头 ， 软 磁 材料 
导 磁 率 高 ， 饱 和 磁感应 强度 大 
矫 顽 力 小 ， 剩 余 磁感应 强度 小 











磁 记 录 材 料 ， 硬 磁 材 料 
记录 密度 高 ， pe 
认 号 幅度 大 ， 噪 声 


薄 厚 均匀 ， 温度、 湿度 影响 小 











图 9.1 磁头 结构 和 电磁 转换 示意 图 


磁头 是 实现 电磁 转换 过 程 的 关键 装置 ,通常 由 软 磁 材 料 ( 外 界 磁 场 的 作用 消失 后 ,该 磁 
性 材料 的 磁性 容易 消失 ) 做 成 。 它 是 一 个 留 有 前 后 间隙 的 磁性 环 状 物体 ,上 面 绕 有 线圈 。 后 
间 孙 越 小 越 好 ,前 间 院 ( 称 为 工作 间隙 ?要 宽窄 适当 。 当 向 线圈 提供 一 定 方向 和 大 小 的 电流 
时 ,将 使 磁头 体 被 磁化 ,建立 起 有 一 定 方向 和 强度 的 磁场 , 即 在 磁 环 内 有 磁力 线 产生 ,由 于 磁 
头 的 前 间隙 处 磁 阻 较 大 ,将 产生 漏 磁 , 这 漏 磁 就 是 向 磁 记 录 介 质 中 写 和 人 信息 的 信息 源 。 

磁 记 录 介质 是 在 某 种 刚性 (如 硬盘 ?或 柔性 (如 软盘 、 磁 带 ) 载 体 上 涂 有 薄 层 磁性 材料 的 
物体 ,用 于 记录 以 磁 状 态 表 示 的 信息 。 磁 记录 介质 用 硬 磁 材 料 ( 外 界 磁场 的 作用 消失 后 ,该 
磁性 材料 的 磁性 尽量 多 地 被 保留 ) 做 成 。 

磁 存 储 器 的 写 人 过 程 : 当 磁 头 前 端 与 磁 记 录 介 质 距离 很 近 时 ,磁头 前 间隙 处 的 漏 磁 将 
把 处 于 附近 的 磁 记 录 介 质 上 的 一 小 片 磁性 材料 磁化 ,而 当 磁 头 离 去 时 ,就 在 这 一 小 片 被 磁化 
的 磁性 材料 区 域 保 留 了 磁化 状态 ,从 而 记录 下 写 和 人 的 一 位 信息 。 若 磁头 线圈 中 无 电流 ,磁头 
就 不 会 被 磁化 ,也 就 不 会 产生 漏 磁 , 则 不 会 对 磁 记 录 介 质 产 生 任何 影响 , 即 无 写 人 操作 。 

磁 存 储 器 的 读 出 过 程 : 当 磁 头 前 端 与 磁 记 录 介 质 距 离 很 近 且 高 速 经 过 时 , 若 所 经 过 的 
磁 记 录 介 质 上 的 一 小 片 磁性 材料 已 被 磁化 .这 一 磁化 状态 将 在 磁头 的 环 体内 产生 磁力 线 , 从 
而 在 磁头 的 线圈 中 感应 出 一 个 脉冲 电流 ,这 表示 读 出 了 记录 在 磁 记 录 介质 中 的 一 位 信息 。 
若 磁 头 所 经 过 的 磁 记 录 介 质 上 的 磁性 材料 未 被 磁化 , 则 磁头 也 就 感应 不 出 任何 磁 状 态 的 变 
化 (实际 上 ,正常 读 写 过 程 中 是 不 会 遇 到 这 种 情况 的 )。 应 该 说 ,磁头 能 感应 到 的 是 磁 记 录 介 
质 中 磁化 状态 的 变化 情况 。 

2. 磁 记 录 方 式 

磁 记 录 方 式 指 的 是 一 种 编码 方法 , 即 按 什么 方案 (规律 ) ,把 一 连 串 的 二 进 制 信息 变换 成 
存储 介质 磁 层 中 的 一 个 序列 的 磁化 翻转 状态 ,并 且 可 以 容易 .可 靠 地 用 读 写 控制 电路 实现 这 
一 转换 过 程 。 选 用 不 同 的 记录 方式 ,对 磁 表 面 设备 的 性 能 有 重要 的 影响 。 评 定 一 种 记录 方 
式 优 劣 的 标准 主要 包括 以 下 3 个 方面 。 

(1) 编码 效率 。 指 记录 密度 与 最 大 磁化 翻转 密度 之 比 , 即 为 记录 一 位 信息 所 用 的 最 多 
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磁化 翻转 次 数 的 倒数 。 若 记录 一 位 信息 ,最 多 要 有 一 次 磁化 翻转 , 则 编码 效率 最 高 ,为 
100%% 。 编 码 效率 直接 影响 可 用 的 记录 密度 和 设备 的 最 大 存储 容量 。 

(2) 自 同步 能 力 。 指 从 读 出 的 数据 信息 中 提取 出 同步 时 钟 信号 的 难 易 程度 。 同 步 时 钟 
信号 是 分 隔 出 连续 多 个 数据 的 不 同位 所 必需 的 时 间 基 准 信号 , 若 能 从 读 出 的 数据 信息 中 提 
取出 这 一 同步 时 钟 信号 , 则 称 折 中 编码 方案 有 自 同步 能 力 ,这 对 某 些 高 记录 密度 的 系统 来 说 
是 希望 具有 的 。 否 则 ,只 能 用 另外 的 办 法 (如 单独 设立 提供 同步 时 钟 信号 的 磁道 ) 来 得 到 同 
步 时钟 信 号 ,这 被 称 为 外 同步 。 

(3) 可 靠 性 问题 。 前 面 已 经 提 到 ,外 存储 设备 的 可 靠 性 是 一 个 要 重点 关注 的 问题 。 好 
的 编码 方案 应 对 提高 外 存储 设备 的 可 靠 性 有 所 体现 。 在 外 存储 设备 中 ,往往 采用 能 检查 错 
误 , 甚 至 自动 纠正 某 些 最 常 遇 到 的 错误 的 必要 措施 。 

当前 最 常用 的 基本 编码 方式 有 如 下 几 种 ,各 自 的 写 和 人 电流 和 磁化 强度 的 波形 如 图 9. 2 
所 示 。 


位 周期 





图 9.2 不 同 记录 方式 的 写 入 脉冲 和 磁化 强度 波形 图 


1) 归 零 制 (RZ) 

这 是 用 向 磁头 线 圈 送 入 正 , 负 脉冲 电流 的 办 法 执行 写 *1”、 写 “0” 操 作 的 方案 ,使 1 和 0 
信和 号 的 磁化 状态 正好 相反 。 它 的 主要 矛盾 是 在 两 个 信息 位 之 间 磁 层 处 于 非 磁化 状态 ,难以 
解决 , 故 不 实用 ,但 对 理解 经 过 电磁 转换 在 磁性 材料 中 记录 二 进 制 信息 的 原理 是 有 帮助 的 。 

2) 不 归 零 制 (NRZ) 

这 是 用 向 磁头 线圈 送 入 正 、 反 向 电流 的 办 法 执行 写 *1”、 写 0” 操作 的 方案 ,使 1 和 0 信 
号 的 磁化 状态 ( 极 性 ) 正 好 相反 。 与 前 一 种 方案 相 比 ,取消 了 两 个 信息 位 之 间 磁 头 线圈 中 无 
电流 的 情况 , 故 磁 层 中 不 存在 未 被 磁化 的 状态 ,不 是 被 正 向 磁化 ,就 是 被 反 向 磁化 。 

3) 见 1 就 翻 的 不 归 零 制 (NRZ1) 

这 是 用 在 写 *1” 时 就 变化 磁头 线圈 中 的 电流 方向 ( 写 *0” 则 不 变 电 流 方向 ) 的 办 法 执行 写 
“1”、 写 “0” 操 作 的 方案 。 

4) 调 相 制 (PM) 

这 是 用 在 磁 层 中 不 同 的 磁化 翻转 方向 来 区 别 数据 "1” 和 “0” 的 方案 ,为 此 ,磁头 线圈 中 的 
电流 ,在 写 *1” 和 写 *0” 时 要 朝 不 同 的 方向 变化 . 读 出 时 ,就 表现 为 读 出 的 信和 号 是 正 还 是 负 脉 
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冲 , 即 二 者 的 信和 号 相位 差 为 180 。 

5) 调频 制 (FM) 

这 是 用 在 磁 层 中 不 同 的 磁化 翻转 次 数 来 区 别 数据 1” 和 “0” 的 方案 ,记录 “1” 比 记录 “0” 
磁化 翻转 频率 要 多 一 倍 。 为 此 ,磁头 线圈 中 的 电流 ,在 每 个 位 周期 起 始 处 要 变化 一 次 方向 ， 
在 写 *1” 时 ,还 要 在 位 周期 中 心 处 再 变化 一 次 方向 ,而 写 *0” 则 不 会 在 位 周期 中 心 处 变化 电流 
方向 。 读 出 时 , 读 出 的 1 信号 表现 为 两 个 脉冲 , 读 出 的 0 信号 表现 为 一 个 脉冲 。 二 者 的 读 出 
脉冲 频率 相差 一 倍 。 

6) 改进 调频 制 (MFMD) 

正 像 它 的 名 字 所 指明 的 ,这 是 对 前 面 讲 的 调频 制 一 种 改进 方案 ,其 目的 是 提高 这 一 方案 
的 编码 效率 ,使 其 从 调频 制 的 50% 提 高 到 现在 的 100%。 这 一 改进 表现 在 取消 了 大 部 分 的 
在 每 个 位 周期 起 始 处 的 改变 磁头 线圈 中 的 电流 方向 的 动作 ,只 保留 在 连续 的 0” 信号 的 每 个 
位 周期 起 始 处 的 电流 方向 变化 ,以 便 保证 该 编码 方式 的 自 同 步 能 力 。 


9.2 磁盘 设备 


磁盘 设备 是 计算 机 系统 中 最 主要 的 外 存 设 备 ,也 是 计算 机 外 围 设备 中 ,在 提高 性 能 和 降 
低 成 本 两 个 方面 取得 骄 人 成 绩 的 最 典型 的 设备 。 目 前 使 用 最 多 最 广 的 是 硬 磁盘 , 硬 磁盘 存 
储 容量 大 , 读 写 速度 快 ,普及 型 产品 价格 也 比较 便宜 。 典 型 的 硬盘 结构 是 温 彻 斯 特 磁 盘 , 简 
称 温 盘 , 它 的 主要 特点 是 密封 组 合式 , 即 磁头 组 和 盘 片 组 件 被 封装 在 净化 腔 体内 ,通常 盘 片 
的 每 面 都 有 一 个 读 写 头 。 磁 盘 设 备 通常 包括 磁 记 录 介 质 、 磁 盘 驱 动 器 .磁盘 控制 器 3 个 组 成 
部 分 。 硬 磁盘 的 逻辑 结构 如 图 9. 3 所 示 。 








(来 自 总 线 ) - 
和 控制 好 辑 “时 名 ( 送 往 总 线 ) 

并 全 数据 rT 并 行 数据 
ml 梧 1. 
开店 变换 电路 站 


























读 / 写 磁头 
磁 介质 层 








载 磁体 
图 9.3 硬盘 存储 器 逻辑 结构 图 
9.2.1 磁 记 录 介 质 


硬 磁盘 盘 片 由 一 个 或 多 个 表面 涂 有 磁性 材料 的 铝 质 平 盘 组 成 。 早 期 的 铝 盘 直径 达 
50cm, 但 现在 一 般 也 就 是 3 一 12cm, 用 于 笔记 本 计算 机 的 磁盘 直径 已 经 在 3cm 以 下 ,而且 还 
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在 缩小 。 一 般 盘 片 的 上 下 两 面 都 能 记录 数据 ,通常 把 磁盘 片 表面 称 为 记录 面 。 记 录 面 上 存 
储 数据 位 的 小 磁 元 构成 的 一 系列 同心 圆 称 为 磁道 。 多 个 盘 片 的 同一 半径 位 置 上 的 磁道 构成 
一 个 柱 面 。 每 个 磁道 可 以 划分 为 固定 长 度 的 扇 区 ,如 图 9.4 所 示 是 磁道 几何 示意 图 。 

每 个 肩 区 一 般 有 可 存放 512 字 节 的 数据 区 ,数据 区 前 有 用 于 在 读 写 之 前 对 磁头 进行 同 
步 的 前 导 区 ,数据 区 之 后 是 纠 错 码 (Error-Correcting Code,ECC) 。 连 续 的 两 个 扇 区 之 间 是 
隔离 带 。 一 些 制造 商 以 未 格式 化 时 的 容量 来 标识 他 们 的 磁盘 ,但 多 数 的 制造 商 给 出 的 是 格 
式 化 后 的 容量 ,没有 把 前 导 区 、 纠 错 码 和 隔离 带 的 容量 作为 数据 区 容量 计算 在 内 。 格 式 化 后 
的 容量 一 般 比 未 格式 化 时 的 容量 少 15%% 左 右 。 

磁头 下 
旋转 的 盘 ~、 
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Ste 

“” ! 位 的 宽度 为 
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磁道 的 宽度 为 
5~10um 


(9) 
图 9.4 磁盘 内 部 示意 图 


9.2.2 磁盘 驱动 器 
磁盘 驱动 器 是 一 种 精密 的 电子 和 机 械 装置 ,包括 作为 磁 记 录 介 质 使 用 的 磁盘 片 和 驱动 

磁盘 匀速 旋转 的 动力 与 驱动 部 件 , 完 成 读 写 功能 的 磁头 和 驱动 磁头 沿 磁盘 径 向 方向 运动 和 

准确 定位 的 部 件 , 以 及 其 他 一 些 控制 逻辑 电路 等 部 件 。 图 9. 5 是 磁盘 驱动 器 结构 示意 图 。 
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图 9.5 磁盘 驱动 器 结构 示意 图 
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1. 主轴 及 其 驱动 系统 

硬 磁 盘 的 盘 片 被 固定 在 磁盘 驱动 器 的 主轴 上 ,由 主轴 带动 磁盘 匀速 旋转 。 磁 盘 驱 动 器 
的 主轴 是 由 一 个 主 电 机 通过 传动 皮带 带动 旋转 的 。 主 电机 的 转速 必须 被 监测 和 进行 自动 调 
节 。 为 保证 有 正常 的 读 写 信号 ,保证 浮动 磁盘 头 与 磁盘 表面 有 合理 的 距离 ,要 求 磁盘 以 一 个 
额定 的 转速 匀速 旋转 。 因 此 ,必须 在 刚 加 电 启动 时 ,检测 磁盘 是 否 已 达到 额定 转速 ,通常 在 
未 达到 这 一 转速 之 前 ,可 以 不 允许 磁头 进入 磁盘 外 沿 之 内 ;在 磁盘 正常 旋转 的 过 程 中 ,还 可 
以 用 一 个 闭环 的 自 调节 系统 使 其 转速 尽 可 能 地 均匀 。 

2. 磁头 及 其 定位 系统 

大 部 分 的 磁盘 系统 中 ,只 为 每 个 磁盘 面 设立 一 个 磁头 ,为 在 磁盘 径 向 方向 的 某 个 位 置 ， 
即 某 一 磁道 ,完成 读 写 , 必 须 驱动 磁头 移 到 并 定位 在 那里 ,实现 这 一 功能 的 部 件 被 称 为 磁头 
定位 驱动 机 构 。 它 由 磁头 小 车 和 驱动 部 件 组 成 ,磁头 被 安装 在 小 车 上 ,小 车 的 运动 带动 磁头 
沿 磁盘 的 径 向 方向 前 进 或 后 退 。 这 样 的 磁盘 系统 被 称 为 活动 头 磁盘 , 它 的 寻找 磁道 的 时 间 
比较 长 。 也 有 一 些 磁盘 ,出 于 提高 读 写 速度 的 需要 ,为 每 个 磁道 分 别 安装 一 个 或 者 多 个 磁 
头 ,使 用 多 个 磁头 能 够 消除 磁头 寻找 磁道 的 时 间 , 这 样 的 磁盘 系统 被 称 为 固定 头 磁盘 。 

3. 数据 读 写 等 控制 逻辑 部 分 

要 读 写 磁盘 上 的 信息 ,首先 必须 给 出 信息 在 磁盘 设备 上 的 准确 位 置 , 这 个 位 置信 息 通常 
由 具体 的 磁盘 面 ,具体 的 磁道 的 哪 一 个 存储 区 域 等 几 部 分 组 成 。 

对 于 写 操 作 , 首 先 要 把 写 信 信息 的 地 址 送 入 磁盘 的 地 址 寄存 器 ,然后 磁盘 的 读 写 控制 逻 
辑 电 路 对 要 写 入 的 信息 进行 编码 处 理 , 经 过 写 入 驱动 器 再 送 入 选 定 的 磁头 的 写 入 线圈 ,把 信 
息 串 行 地 写 入 选 定 的 磁道 中 ; 写 入 操作 伴 有 比较 完善 的 出 错 检 查 , 并 同时 把 这 些 检 查 结果 的 
信息 (如 CRC 码 ) 也 写 在 特定 的 存储 区 ,用 于 读 操作 时 复核 读 出 结果 的 正确 性 。 

对 于 读 操作 ,首先 使 磁头 移动 到 由 磁盘 地 址 寄存 器 指定 的 存储 区 域 ,选中 的 磁头 执行 读 
操作 , 读 出 信号 送 读 出 放大 器 ,经 译 码 电路 分 离 出 数据 脉冲 ,拼装 成 字 节 或 字 的 格式 送 入 磁 
盘 接口 。 读 的 过 程 也 伴 有 出 错 检查 ,甚至 是 自动 纠 错 等 操作 。 


9.2.3 磁盘 控制 器 


磁盘 控制 器 即 磁盘 驱动 器 适配器 ,是 计算 机 主机 与 磁盘 驱动 器 之 间 的 接口 设备 。 它 接 
收 并 解释 计算 机 主机 发 来 的 命令 ,向 磁盘 驱动 器 发 出 各 种 控制 信号 。 检 测 磁盘 驱动 器 状态 ， 
按照 规定 的 磁盘 数据 格式 ,把 数据 写 和 磁盘 和 从 磁盘 读 出 数据 。 

磁盘 控制 器 类 型 很 多 ,但 它 的 基本 组 成 和 工作 原理 大 体 上 是 相同 的 。 磁 盘 控 制 器 主要 
由 与 计算 机 系统 总 线 相连 的 控制 逻辑 电路 , 微 处 理 器 ,完成 读 出 数据 分 离 和 写 入 数据 补偿 的 
读 写 数据 解码 和 编码 电路 ,数据 检 错 和 纠 错 电路 ,根据 计算 机 主机 发 来 的 命令 对 数据 传递 、 
串 并 转换 以 及 格式 化 等 进行 控制 的 逻辑 电路 ,存放 磁盘 基本 输入 输出 程序 的 只 读 存 储 器 和 
用 以 数据 交换 的 缓冲 区 等 部 分 组 成 。 

现在 微型 计算 机 的 磁盘 系统 中 应 用 最 为 广泛 的 磁盘 接口 有 IDE、SCSI 和 SATA 等 。 

IDE 和 EIDE 接口 在 微机 中 得 到 了 广泛 的 使 用 。 普 通 IDE 的 特点 是 ,数据 传输 率 小 于 
1. 5MB/s, 最 多 连接 两 个 IDE 设备 (硬盘 或 其 他 设备 ) 和 每 个 IDE 硬盘 容量 小 于 528MB。 
而 EIDE 的 特点 是 ,数据 传送 率 为 2~18MB/s. 最 多 可 连 4 个 IDE 设备 ,EIDE 硬盘 容量 互 
以 超过 528MB ,同时 支持 逻辑 块 寻 址 (LBA) ,并 能 控制 CD-ROM 驱动 器 。EIDE 控制 器 通 
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常 接 在 VESA 总 线 和 PCI 总 线 上 。 
SCSI 是 用 于 小 型 机 和 微型 机 的 外 部 设备 接口 。 不 同 版 本 的 SCSI 的 数据 宽度 为 8 ~ 32 
位 ,数据 传输 率 为 5 一 40MB/s,SCSI 接口 最 多 可 连接 1 一 7 个 SCSI 设备 。 除 了 硬盘 外 ,还 
可 以 是 CD-ROM、CD 刻录 机 、 扫 描 仪 .磁带 机 或 其 他 SCSI 计算 机 外 设 。 每 个 设备 有 两 个 插 
一 个 用 于 输入 , 另 一 个 用 于 输出 。 每 个 SCSI 设备 有 一 个 唯一 的 ID ,编号 从 0 一 7。 常 见 
的 8 位 数据 SCSI 电缆 线 有 50 线 , 其 中 地 线 ( 有 利于 噪声 屏 项)25, 数 据 线 、 校 验 位 控制. 电 
源 和 预 留 25,16/32 位 数据 设备 需 第 2 根 电缆 提供 其 他 信号 。 


9.3 磁盘 阵列 


作为 计算 机 系统 外 存储 器 的 主要 支柱 设备 ,磁盘 的 容量 、 读 写 速度 、 价 格 和 容错 支持 ,一 
直 是 人 们 致力 解决 的 问题 。 过 去 很 长 一 段 时 间 ,研究 工作 多 集中 在 提高 ,改善 单个 个 体 磁 盘 
机 的 性 能 方面 ,因为 待 改善 的 性 能 、 要 做 的 技术 工作 都 有 较 大 的 选择 余地 ,这 些 工作 也 确实 
取得 了 巨大 成 绩 , 极 大 地 推动 了 磁盘 的 普及 应 用 。 但 这 是 不 是 解决 问题 的 唯一 途径 呢 ? 显 
然 不 是 ,另外 一 个 可 行 途径 ,是 使 用 统一 管理 的 由 多 个 磁盘 组 成 的 磁盘 阵列 。 

0 个 科研 小 组 提出 来 ,并 且 很 快 成 为 被 工业 界 广泛 接受 的 
一 项 技术 。 这 一 技术 的 着 眼 点 ,还 是 通过 多 个 磁盘 设备 的 并 行 操作 来 提高 设备 总 体 的 性 能 
和 可 靠 性 。 ee hd 个 磁盘 有 x MB 的 容量 ,单位 时 间 提 供 > MB 的 传送 能 力 , 则 
概念 上 讲 ,n 个 这 样 的 磁盘 就 有 (nXzx)MB 的 容量 ,(nXy)MB 的 传送 能 力 , 换 句 话 说 ,要 读 
出 y MB 的 数据 ,所 用 的 平均 时 间 只 要 原来 单个 磁盘 所 用 时 间 的 1/n; 此 外 ,还 有 一 点 好 处 
是 ,通过 合理 地 在 多 个 磁盘 之 间 组 织 数据 ,可 以 得 到 比较 理想 的 容错 能 力 ,这 指 的 是 ,额外 拿 
出 一 定 的 存储 容量 ( 宛 余 ), 用 于 保存 检 错 纠 错 的 信息 。 

从 总 体 价格 上 考虑 ,使 用 多 个 磁盘 也 并 不 会 给 用 户 带 来 太 大 的 经 济 负担 。 因 此 ,该 科研 
小 组 在 提出 这 一 技术 思路 时 ,用 的 词 为 Redundancy Arrays of Inexpensive Disks(RAID)， 
但 到 了 工业 界 , 却 更 愿意 把 这 里 的 Inexpensive 换 成 Industry, 在 原来 技术 概念 的 基础 上 加 


为 统一 管理 磁盘 阵列 ,使 用 户 所 感觉 到 的 不 再 是 多 个 物理 盘 , 似 乎 就 是 一 个 性 能 更 高 的 
单个 磁盘 ,就 要 使 用 一 块 特定 的 接口 卡 (一 般 称 为 RAID 卡 ,阵列 控制 卡 ), 把 组 成 阵列 的 多 
个 物理 磁盘 连接 为 一 个 迎 辑 整体 ,这 被 称 为 一 个 迎 辑 磁 

级, 如 图 9.6 所 示 。 该 卡 的 一 端 将 被 插 接 到 高 速 的 SCSI 四 四 四 四 
总 线 或 PCI 总 线 的 插 模 中, 以便 与 计算 机 主机 接 通 . 另 【中 | 是 | 




















外 一 端 有 1 一 3 个 接 插 头 . 通 过 电缆 与 1 一 3 组 磁盘 设备 
连接 ,每 组 可 有 串 行 连接 在 一 起 的 1 一 7 物理 磁盘 。 该 图 9.6 磁盘 阵列 示意 图 
卡 是 一 个 有 较 强 处 理 能 力 的 接口 电路 .上面 有 一 个 单 片 
计算 机 ,形成 奇偶 校 验 信息 的 机 构 , 分 析 与 处 理 主机 CPU 发 送 来 的 读 写 磁盘 命令 的 机 构 ， 
有 起 缓冲 作用 的 DRAM 存储 器 (又 被 称 为 阵列 加 速 器 , 几 MB 到 几 十 MB 容量 ,分 成 两 个 体 
以 镜像 方式 运行 ,还 有 专用 的 后 备 电池 支持 ) 等 几 个 组 成 部 分 。 系 统 能 通过 该 卡 对 连接 到 卡 
上 的 多 个 磁盘 , 按 用 户 的 使 用 要 求 , 灵 活 地 配置 为 不 同 的 使 用 和 容错 方式 。 

阵列 磁盘 运行 过 程 中 ,有 两 项 重要 技术 对 磁盘 系统 的 运行 性 能 产生 较 大 影响 。 一 
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并 发 命令 请 求 和 命令 排队 ,就 是 说 CPU 可 以 向 磁盘 设备 发 送 多 条 命令 ,阵列 卡 会 对 这 些 命 
令 进行 排队 管理 ,并 使 多 个 命令 得 以 并 发 处 理 ; 如 果 在 处 理 命令 的 时 候 , 还 能 进行 某 些 性 能 
优化 ,而 不 是 机 械 地 按 命 令 到 来 的 先后 次 序 处 理 ,还 可 以 进一步 提高 数据 读 写 的 速度 。 最 简 
单 的 例子 就 是 对 两 个 等 待 读 操 作 的 命令 ,磁头 先 到 达 哪 一 个 命令 的 数据 扇 区 ,就 先 执行 哪 一 
个 命令 ,这 在 磁盘 本 身 的 控制 器 部 分 来 处 理 可 能 更 方便 。 另 外 一 项 技术 是 设备 的 快速 接 人 
和 断 开 , 即 当 一 个 占据 了 总 线 的 磁盘 开始 执行 一 个 读 命令 ,数据 又 尚未 准备 好 时 , 它 应 快速 
地 和 暂时 把 自己 从 总 线 上 断 离 出 来 ,以 便 使 另外 正 急 于 使 用 总 线 的 磁盘 可 能 抢 到 总 线 , 从 而 提 
高 总 线 的 使 用 效率 和 系统 性 能 ; 当 这 个 磁盘 准备 好 数据 时 ,应 保证 它 能 把 自己 尽快 地 接 通 到 
总 线 上 去 (得 到 总 线 的 使 用 权 )。 这 实质 上 是 把 占用 总 线 的 时 间 压 缩 到 尽 可 能 短 的 一 项 处 理 
技术 。 

阵列 磁盘 的 一 个 重要 的 特性 就 支持 容错 。 合 理 地 把 一 个 文件 的 内 容 划分 为 " 块 "并 写 到 
组 成 一 个 逻辑 磁盘 的 多 个 物理 磁盘 中 去 ,再 采取 适当 的 数据 存储 保护 措施 ,不 仅 可 以 提高 数 
据 读 写 的 速度 ,而 且 可 以 大 大 增加 磁盘 系统 工作 的 可 靠 性 ,就 是 说 使 该 磁盘 系统 具有 很 好 的 
容错 能 力 。 提 出 这 一 技术 思路 的 研究 人 员 把 这 一 容错 划分 成 6 种 模式 ,又 经 常 被 说 成 6 级 
容错 ,分 别 叫 作 RAIDO .RAID2、…、RAID5。 其 中 的 RAID2 方案 与 磁盘 设备 本 身 的 工作 特 
性 不 完全 符合 ,RAID3 要 求 多 个 物理 磁盘 同 速 并 保持 相关 扇 区 同步 ,难以 得 到 好 的 性 能 / 价 
格 比 , 较 少 采用 ,其 他 4 种 已 被 工业 界 广泛 接受 并 在 一 些 产品 中 得 到 实际 应 用 。 

RAIDO 模式 是 指 把 一 个 文件 的 数据 分 成 容量 相等 (例如 16KB) 的“ 抉 "(Chunk) ,把 每 
一 段 交 替 地 分 别 写 到 不 同 的 物理 磁盘 的 几 个 扇 区 中 去 ,这 种 处 理 叫 Data Striping。 它 的 好 
处 是 ,不 仅 可 以 使 几 个 磁盘 合 起 来 有 更 大 的 容量 ,还 可 以 让 多 个 物理 磁盘 并 发 读 写 ,提高 了 
数据 输入 输出 的 吞吐 率 ; 它 并 没有 采用 任何 容错 措施 , 故 没 有 容错 能 力 。 磁 盘 可 用 存储 容量 
全 部 用 于 存储 实际 数据 ,如 图 9.7 所 示 。 
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图 9.7 RAID0 ,Data Striping 


RAID1 模式 是 实现 两 个 磁盘 互 为 备份 的 用 法 , 即 把 相同 的 数据 分 别 写 到 这 样 配对 使 用 
的 两 个 磁盘 中 去 ,这 叫 作 磁 盘 镜 像 (Drive Mirroring) ,这 一 Disk0 Disk 1 
写 操作 是 对 两 个 磁盘 同时 进行 的 ,不 会 有 降低 写 和 速度 的 镜像 
矛盾 。 它 的 最 大 好 处 是 数据 被 同时 保存 在 两 个 磁盘 中 . 若 | a 6 
其 中 任何 一 个 磁盘 出 现 故障 ,可 以 从 另 一 个 磁盘 中 读 出 数 
据 , 而 不 会 出 现 令 人 难以 接受 的 丢失 数据 的 局 面 。 读 操作 
时 ,也 许 还 会 碰 上 读 出 数据 略 快 一 点 的 情况 。 它 的 不 足 之 处 是 ,镜像 磁盘 总 存储 容量 的 有 效 
利用 率 只 有 50%。 

这 里 的 镜像 是 完全 用 硬件 实现 的 ,运行 速度 快 ; 磁 盘 镜像 也 可 以 用 软件 (操作 系统 ) 实 
现 ,甚至 于 用 在 仅 有 一 个 磁盘 的 计算 机 系统 ,其 运行 速度 要 大 受 影响 。 在 有 硬件 镜像 的 系统 


图 9.8 RAID1,Drive Mirroring 
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中 ,不 要 再 指定 软件 镜像 ,否则 会 把 有 关 镜 像 的 数据 文件 都 存 成 4 份 ,系统 运行 速度 和 所 使 
用 的 磁盘 空间 都 难以 令 人 接受 。 

RAID4 模式 是 为 N 个 存储 数据 的 磁盘 分 配 另 外 一 个 专用 于 存储 奇偶 校 验 信息 的 磁 
盘 , 它 仍 以 Data Striping 为 基础 ,但 在 把 文件 数据 分 块 写 进 多 个 数据 磁盘 的 同时 ,对 这 些 数 
据 中 相应 的 几 位 求 出 它们 的 奇偶 校 验 值 , 最 终 形成 一 个 由 奇偶 校 验 值 组 成 的 信息 快 , 并 将 其 
写 人 专用 于 存储 奇偶 校 验 信息 的 磁盘 ,这 被 称 为 数据 保护 (Data Guarding)。 它 的 好 处 是 提 
供 了 容错 能 力 , 即 这 N 十 1 个 磁盘 中 任何 一 个 出 现 故 障 ,都 不 会 造成 丢失 数据 的 问题 ,可 以 
用 剩 下 的 N 个 磁盘 的 内 容 , 计 算出 存放 在 有 故障 磁盘 中 的 正确 的 数据 内 容 , 尽 管 这 一 计算 
比较 费时 间 。 与 磁盘 镜像 相 比 . 它 的 存储 容量 的 有 效 利用 率 可 以 更 高 ,为 N/(N 十 1)。 这 种 
模式 下 ,最 少 的 物理 磁盘 数量 为 3。 它 的 缺点 ,一 是 用 运行 正常 的 N 个 磁盘 的 内 容 计 算出 有 
故障 磁盘 中 的 正确 数据 比较 费时 间 ; 二 是 受 奇偶 磁盘 的 制约 ,不 支持 多 个 数据 磁盘 的 并 行 写 
操作 ,如 图 9.9 所 示 。 


数据 数据 数据 奇偶 (Parity) 
Disk 0 Disk 1 Disk 2 Disk 3 


0 S . S > 人 
P 为 数据 块 1、2、3 的 奇偶 值 ，P, 为 数据 块 4、5、6 的 奇偶 值 
图 9.9 RAID4.Data Guarding 














RAID5 模式 是 对 RAID4 的 改进 。 这 一 改进 表现 在 : 不 再 区 分 N 个 存储 数据 的 磁盘 和 
另外 一 个 专用 的 奇偶 校 验 磁盘 , 它 是 把 N 十 1 个 磁盘 同等 对 待 , 都 用 于 存放 数据 和 奇偶 校 验 
信息 ,在 同一 个 物理 盘 中 ,数据 和 奇偶 校 验 信息 是 以 不 同 扇 区 的 形式 体现 出 来 的 ,这 被 称 为 
分 布 式 数据 保护 (Distributed Data Guarding) ,如 图 9. 10 所 示 。 与 RAID4 同样 , 它 提供 了 
容错 能 力 , 即 这 NN 十 1 个 磁盘 中 任何 一 个 出 现 故 障 ,都 不 会 造成 丢失 数据 的 问题 ,可 以 用 剩 
下 的 N 个 磁盘 的 内 容 , 计 算出 存放 在 有 故障 磁盘 中 的 正确 的 数据 内 容 , 存 储 容量 的 有 效 利 
用 率 同样 为 N/(N 十 1)。 这 种 模式 下 ,最 少 的 物理 磁盘 数量 为 3。 在 一 些 情况 下 ,可 能 可 以 
对 多 个 磁盘 执行 并 行 写 操作 ,因为 它 不 再 受 单独 一 个 奇偶 磁盘 的 制约 。 


数据 块 1 数据 块 2 | 。 | 数据 块 3 奇偶 块 1 
数据 块 4 数据 块 5 | ”| 奇偶 块 2 数据 块 6 
数据 块 7 奇偶 块 3 | 。 | 数据 块 8 数据 块 9 
奇偶 块 4 | 。 | 数据 块 10| | 数据 块 11 | 。 | 数据 块 12 

Disk 0 Disk 1 Disk 2 Disk 3 


吧 则 由 的 


图 9.10 RAID5 ,Distributed Data Guarding 



































除 此 之 外 ,阵列 盘 技 术 还 支持 联机 热 备份 磁盘 , 即 把 一 台 磁盘 接 入 计算 机 系统 中 ,平时 
它 并 不 执行 读 写 操作 ,只 以 备份 者 的 身份 出 现 , 当 带 有 容错 支持 的 阵列 盘 中 某 一 磁盘 出 现 故 
障 时 ,就 令 这 台 备 份 磁盘 立刻 "上岗 "。 首 先 把 出 现 故障 磁盘 中 的 数据 复制 (会 用 到 容错 支 
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持 ) 到 已 “上 岗 ” 的 磁盘 中 ,之 后 用 这 台 磁 盘 顶 蔡 已 出 现 故 障 的 磁盘 继续 投入 运行 。 接 下 来 可 
以 把 有 故障 的 磁盘 从 系统 中 取 下 来 进行 维修 。 有 容错 支持 和 配 有 备份 磁盘 的 系统 中 ,从 发 
现 磁 盘 故 障 到 启用 备份 磁盘 ,恢复 故障 磁盘 中 的 数据 到 备份 磁盘 、 停 止 有 故障 磁盘 的 运行 而 
用 备份 磁盘 顶替 它 的 这 一 完整 过 程 , 若 都 经 由 计算 机 系统 的 硬 软件 自动 执行 (无 须 操作 或 管 
理 人 员 干 预 ), 这 被 称 为 数据 的 自动 恢复 ,通常 要 用 几 到 十 几 分 钟 的 时 间 完 成 。 

车 在 系统 不 断 电 , 磁 盘 设 备 也 不 断 电 的 情况 下 ,可 以 直接 把 一 台 设 备 从 系统 中 拔 下 来 或 
接 通 上 去 ,这 叫 热 插 拔 技术 。 它 必然 只 能 用 在 带 有 容错 支持 的 阵列 盘 系 统 中 ,需要 有 相应 软 
件 、 总 线 、 接 口 和 设备 几 个 方面 的 支持 。 


9.4 光盘 设备 


20 世纪 80 年 代 , 出 现 了 一 种 新 的 存储 介质 一 一 光盘 。 光 盘存 储 密度 高 于 普通 的 磁盘 ， 
原本 是 为 存储 电视 节目 而 开发 的 ,但 作为 计算 机 的 存储 设备 , 它 能 发 挥 更 好 的 作用 。 由 于 其 
潜在 的 巨大 存储 能 力 ,对 光盘 的 研究 已 经 是 一 个 重要 的 课题 ,从 最 早 的 只 读 光盘 发 展 到 后 来 
的 可 刻 光盘 、 可 擦 写 光盘 ,已 经 取得 了 巨大 的 进步 ,光盘 的 容量 以 及 光盘 驱动 器 的 读 写 速度 
都 有 了 大 幅度 的 提高 。 下 面 对 几 种 不 同类 型 的 光盘 分 别 做 一 下 简单 的 介绍 。 


9.4.1 只 读 光 盘 


第 一 代 光 盘 是 由 荷兰 的 电子 企业 集团 飞利浦 公司 发 明 的 ,用 来 存放 电影 。 大 小 为 30 厘 
米 左右 ,以 激光 影碟 的 名 称 面市 。1980 年 .飞利浦 和 索尼 一 起 推出 了 光盘 (Compact Disc， 
CD) ,并 很 快 取代 了 乙烯 基 唱 片 。CD 的 详尽 技术 细节 以 正式 的 国际 标准 (ISO/IEC 10149) 
公布 ,并 因为 封面 的 颜色 被 通称 为 红皮书 。 国 际 标准 规定 所 有 的 CD 大 小 为 120mm 左右 ， 
厚度 为 1.2mm 左右 ,中 心 有 一 直径 为 15mm 的 孔 。 

CD 是 通过 在 涂 有 玻璃 表层 的 主 盘 上 .用 高 能 红外 激光 束 烧 出 0. 8mm 直径 的 小 孔 制 成 
的 。 用 这 种 主 盘 做 成 模子 .上 面 带 有 人 烧 好 的 激光 孔 , 然 后 往 模子 上 注入 熔化 的 多 种 碳酸 盐 
脂 ,使 激光 孔 的 形状 和 玻璃 主 盘 的 形状 一 样 ,就 基本 上 完成 了 CD 的 主体 。 接 着 ,在 碳酸 盐 
脂 上 沉淀 上 一 薄 层 的 反射 铝 , 再 覆盖 上 一 层 起 保护 作用 的 表层 ,最 后 再 打上 标签 ,整个 CD 
就 完成 了 。 碳 酸 盐 脂 底 基 的 凹陷 部 分 叫 作 目 区 , 凹 区 两 边 未 经 过 烧 制 的 部 分 叫 作 凸 区 。 

将 CD 进行 回放 时 ,用 一 个 低能 激光 二 极 管 发 出 的 波长 为 0.78mm 的 红外 光照 射 在 二 
极 管 下 " 流 过 ”的 凹 区 和 凸 区 。 光 源 在 碳酸 盐 脂 层 的 上 方 ,所 以 , 当 凹 区 经 过 时 ,激光 束 就 会 
比 凸 区 经 过 时 伸 出 一 些 。 由 于 四 区 的 高 度 为 激光 波长 的 1/4, 从 四 区 反射 的 激光 的 波长 为 
从 西区 反射 光 的 波长 的 一 半 。 这 样 ,反射 光 和 发 射 光 倒 加 ,将 导致 光 接 收 器 接收 到 的 从 凹 区 
反射 的 光线 比 从 凸 区 反射 的 要 弱 。CD 机 通过 这 种 途径 ,可 以 区 别 出 凹 区 和 凸 区 。 虽 然 用 
四 区 代表 0, 凸 区 代表 1 可 能 是 最 简单 的 表示 方法 .但 从 可 靠 性 方面 考虑 ,用 是 区 /四 区 和 四 
区 / 凸 区 转换 来 表示 1 ,而 用 连续 的 凹 区 或 凸 区 来 表示 0 的 可 靠 性 要 高 一 些 ,所 以 ,CD 上 采 
用 的 是 这 种 模式 。 

四 区 和 上 是 区 写 在 一 根 单 向 的 螺旋 线 上 ,螺旋 线 从 靠近 孔 的 地 方 发 出 ,一 直到 离 盘 边 
32mm 处 ,如 图 9. 11 所 示 。 螺 旋 线 在 盘 上 共有 22188 圈 ( 每 毫米 约 600 圈 ) ,如 果 没 有 损坏 
的 话 , 长 度 为 5. 6km。 
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为 使 光盘 上 的 音乐 以 恒定 的 速度 播放 .就 必须 保 
证 止 区 和 凸 区 * 流 动 ”的 线 速度 保持 人 恒定。 也 就 是 说 ， 
随 着 CD 机 的 读 盘 头 从 里 到 外 移动 ,CD 盘 的 旋转 速度 
必须 持续 下 降 。 在 里 圈 ,旋转 速度 应 为 530r/min, 以 达 
到 理想 的 线 速度 一 一 120cm/min; 到 外 圈 后 ,要 使 读 盘 
头 保持 同样 的 线 速度 ,旋转 速度 应 降 到 200r/min。 保 
持 恒定 线 速 度 的 光盘 驱动 器 和 硬盘 驱动 器 有 很 大 区 
别 , 硬 盘 驱 动 器 不 管 磁 头 在 什么 位 置 都 保持 恒定 的 角 
速度 。 而 且 ,530r/min 的 角速度 和 大 多 数 硬盘 驱动 器 、 图 9.11 光盘 和 只 读 光 盘 的 记录 结构 
3600 一 7200r/min 的 角速度 也 有 很 大 的 差别 。 

1984 年 ,飞利浦 和 索尼 认识 到 用 CD 存放 计算 机 数据 的 潜在 可 能 ,共同 出 版 了 黄皮书 ， 
精确 定义 了 现在 被 称 为 只 读 光 盘存 储 器 (Compact Disc-Read Only Memory,CD-ROM) 的 
CD 的 标准 。 为 了 占领 当时 已 经 很 大 的 音频 CD 市 场 ,CD-ROM 采用 了 和 音频 CD 一 样 的 外 
形 、 大 小 ,在 机 械 和 光学 两 方面 和 音频 CD 兼容 ,甚至 采用 相同 的 铸模 机 生产 。 

黄皮书 中 定义 了 CD-ROM 中 计算 机 数据 的 格式 , 它 提高 了 系统 的 纠 错 能 力 ,这 对 CD- 
ROM 来 说 十 分 重要 。 因 为 音乐 迷 们 可 能 并 不 太 在 意 音频 CD 中 这 儿 或 那儿 丢 了 一 位 ,但 计 
算 机 用 户 对 此 却 十 分 挑剔 。CD-ROM 的 基本 数据 格式 将 每 个 字 节 编码 成 14 位 的 符号 。 本 
书 前 面 已 经 提 到 ,14 位 足够 将 8 位 长 的 字 节 进行 汉 明 编码 ,还 有 两 位 剩余 。 实 际 上 ,CD- 
ROM 采用 的 是 新 的 编码 系统 ,将 读 出 的 14 位 符号 映射 到 8 位 的 字 节 是 通过 硬件 查 表 进 
行 的 。 

连续 的 42 个 符号 一 组 ,构成 了 588 位 的 帧 。 每 帧 包含 192 位 数据 位 (24 个 字 节 ), 其 他 
的 396 位 用 于 纠 错 和 控制 位 。 一 直到 此 .音频 CD 和 CD-ROM 的 数据 存储 模式 完全 相同 。 
黄皮书 中 增加 的 内 容 是 将 98 帧 作为 一 个 CD-ROM 扇 区 .定义 了 两 种 数据 存储 格式 。 单 速 
CD-ROM 驱动 器 的 工作 速度 为 75 个 扇 区 每 秒 , 对 于 第 一 种 存储 格式 光盘 的 数据 速率 是 
153600B/s; 第 二 种 存储 格式 光盘 的 数据 速率 为 175200B/s。 倍 速 光盘 的 速度 为 其 两 倍 ,其 
他 速度 的 驱动 器 也 可 以 此 类 推 。 标 准 音频 CD 的 容量 是 存放 74 分 钟 的 音乐 ,如 果 采 用 的 是 
第 一 种 存储 格式 ,容量 是 681984000B, 也 就 是 一 般 说 的 650MB。 

1986 年 ,飞利浦 再 次 通过 发 布 绿 皮 书 ,增加 了 图 形 标准 和 在 一 个 扇 区 内 交叉 存放 音频 、 
视频 和 数据 的 能 力 , 为 多 媒体 CD-ROM 黄 定 了 基础 。 

CD-ROM 在 出 版 游戏 .电影 、 百 科 全 书 、 地 图 集 等 各 种 各 样 的 著作 获得 广泛 的 应 用 。 目 
前 的 大 多 数 商 业 软 件 也 来 自 CD-ROM。 其 大 容量 和 低 造价 的 完美 结合 将 使 它 的 应 用 得 到 
进一步 的 推广 。 


9.4.2 可 刘 光 盘 


早期 制作 CD-ROM 母 盘 的 设备 十 分 昂贵 ,但 是 .作为 计算 机 行业 的 规律 ,不 会 有 任何 东 
西 长 久 处 于 高 价位 。 到 20 世纪 90 年 代 中 期 ,CD 刻 盘 机 的 大 小 已 和 普通 的 读 盘 机 相差 无 
几 ,并 作为 普通 的 外 围 设备 出 现在 许多 计算 机 商场 中 。 由 于 一 旦 写 过 以 后 ,CD-ROM 的 内 
容 将 无 法 擦 除 ,这 种 设备 和 磁盘 比 还 是 有 些 不 足 。 但 是 . 刻 盘 机 还 是 很 快 在 作为 大 容量 磁盘 
的 备份 介质 、 允 许 个 人 或 正在 起 步 的 小 公司 小 批量 生产 自己 的 CD-ROM 或 为 大 批量 生产 商 
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用 CD 制作 母 盘 等 许多 应 用 中 找到 了 生存 之 地 。 用 于 刻 盘 机 进行 刻录 的 光盘 ,我 们 称 其 为 
可 刻 光 盘 , 也 就 是 通常 说 的 CD-R(CD-Recordable)。 

CD-R 在 大 小 上 和 CD-ROM 一 样 ,最 初时 也 是 120mm 的 空白 盘 , 只 是 CD-R 有 一 条 
0. 6mm 宽 的 凹 槽 ,用 来 引导 激光 进行 刻 盘 。 凹 槽 有 0. 3mm 的 正弦 偏 移 ,频率 为 22.05kHz， 
用 来 准确 控制 CD-R 的 转速 ,并 在 必要 时 加 以 调整 。 外 观 上 CD-R 也 和 普通 的 CD-ROM 相 
同 , 只 是 CD-R 表面 是 金色 ,而 不 像 CD-ROM 那样 表面 是 银色 。 表 面 是 金色 是 因为 CD-R 
用 真正 的 金子 代替 铝 来 做 反射 层 。 和 真正 的 CD-ROM 不 同 , 它 们 的 表面 是 实 实在 在 的 凹凸 
不 平 ,而 CD-R 的 凹 区 和 凸 区 是 用 不 同 的 反射 光 来 模拟 ,这 点 是 通过 在 碳酸 盐 脂 和 金 质 反 射 
层 之 间 加 上 一 层 染料 来 实现 的 ,如 图 9. 12 所 示 。 目 前 使 用 的 有 两 种 不 同 的 染料 ,一 种 是 花 
青 染 料 , 其 颜色 是 绿色 的 ; 另 一 种 是 金色 染料 ,颜色 为 黄 橘 色 。 化 学 家 们 正在 为 这 两 种 染料 
哪 种 更 好 一 些 吵 个 没完 。 这 些 染料 和 显 像 中 的 染料 十 分 类 似 , 这 也 是 柯达 和 富士 成 为 CD- 
R 的 主要 制造 商 的 原因 。 

CD-R 被 刻 之 前 ,染料 层 是 透明 的 ,激光 东 可 以 穿 过 它 后 从 金 质 层 反射 回来 。 刻 盘 时 ， 
照射 CD-R 的 激光 能 量 被 调 高 到 8 一 16mW ,光束 照射 到 染料 的 一 个 点 上 时 产生 的 热量 使 之 
发 生化 学 反应 ,改变 了 染料 的 分 子 结构 ,产生 一 个 黑 点 。 读 出 时 (激光 东 的 能 量 为 0. 5mW)， 








光 接 收 器 就 可 以 分 辨 出 染料 被 照射 过 的 黑 点 和 未 被 照射 过 的 透明 区 ,并 用 这 个 区 别 来 对 应 
普通 光盘 的 止 区 和 凸 区 ,甚至 在 普通 的 CD-ROM 或 音频 CD 的 读 盘 机 上 也 是 这 样 区 分 的 。 
印刷 标签 
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图 9.12 CD-R 光盘 截面 图 


每 种 CD 都 有 其 引 以 为 豪 的 颜色 作为 标准 的 封面 ,CD-R 也 不 例外 , 它 的 标准 被 称 为 橘 
皮 书 ,于 1989 年 出 版 。 这 个 标准 除 定义 了 CD-R 的 格式 之 外 .还 定义 了 CD-ROM XA 的 格 
式 , 这 种 新 的 格式 允许 增 量 刻写 CD-R, 今 天 几 个 扇 区 ,明天 几 个 扇 区 ,然后 下 个 月 再 刻 几 个 
扇 区 。 一 次 刻 在 CD-R 上 的 几 个 连续 扇 区 被 称 为 CD-ROM 道 。 

CD-R 的 出 现 使 各 行 各 业 和 公司 能 方便 地 对 CD-ROM( 包 括 音 频 CD) 进 行 复 制 ,也 逐渐 
带 来 了 对 出 版 商 版 权 的 侵犯 。 目 前 .人们 已 经 发 明了 一 些 办 法 来 为 盗版 制造 障碍 ,甚至 使 
CD-ROM 离开 出 版 商 提供 的 读 盘 软件 就 无 法 读 出 。 办 法 之 一 是 将 CD-ROM 上 所 有 文件 的 
长 度 写成 好 几 个 吉 字 节 , 这 样 ,用 标准 的 读 盘 软件 将 无 法 将 文件 拷 到 硬盘 中 ,而 文件 的 实际 
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长 度 在 出 版 商 提供 的 专用 读 盘 软 件 中 或 隐藏 (可 能 还 是 加 密 后 ) 在 CD-ROM 的 某 个 意 想 不 
到 的 地 方 。 另 一 种 办 法 是 在 选 定 的 几 个 扇 区 中 有 意 写 人 人 一些 错误 的 ECC 码 , 预计 一 般 的 
CD 复制 软件 将 会 自动 修复 ”这些 错 误 ,但 光盘 的 应 用 软件 却 自己 对 这 些 ECC 码 进行 检查 ， 
如 果 它们 正确 就 停止 执行 。 还 可 以 采用 非 标准 的 道 间 沟 或 其 他 的 物理 上 的 “ 硬 伤 " 来 防止 对 
CD 的 非法 复制 。 


9.4.3 可 掠 写 光 盘 


尽管 CD-R 使 用 起 来 很 方便 ,价格 也 足够 便宜 ,但 大 家 还 是 希望 有 可 多 次 写 的 CD- 
ROM。 能 满足 人 们 这 个 需求 的 是 可 擦 写 光 盘 CD-RW(CD-ReWritable) ,其 大 小 和 CD-R 相 
同 。 当 然 , 用 的 染料 不 再 是 花 青 和 金色 染料 ,而 是 用 银 、 钢 、 镜 和 磁 组 成 的 合金 做 记录 层 。 这 
种 合金 有 两 个 稳定 态 : 晶 态 和 非 晶 态 ,两 个 状态 有 不 同 的 反射 特性 。 

CD-RW 的 驱动 器 使 用 3 种 不 同 能 量 的 激光 。 在 高 能 激光 照射 下 ,合金 熔化 并 从 高 反 
射 性 的 晶 态 转化 为 低 反 射 性 的 非 晶 态 .表示 凹 区 。 在 能 量 中 等 的 激光 束 照射 下 ,合金 熔化 并 
重新 转化 为 本 来 的 晶 态 ,又 成 为 止 区 。 低 能 激光 可 以 感知 材料 的 状态 (用 来 读 盘 ) ,但 不 会 导 
CD-RW 未 能 取代 CD-R 的 原因 是 CD-RW 的 空 盘 价格 高 出 CD-R 空 盘 许多 。 而 且 , 对 
那些 备份 硬盘 的 应 用 来 说 ,CD-R 只 允许 一 次 写 , 不 会 被 误 操作 清除 的 特性 也 是 一 大 优点 。 


9.4.4 DVD 


最 初 的 CD/CD-ROM 格式 于 1980 年 面世 ,从 此 ,CD 技术 以 日 新 月 异 的 速度 得 到 发 展 ， 
到 现在 ,大 容量 的 光盘 价格 已 相当 低廉 ,市 场 需求 巨大 。 好 莱 坞 极其 愿意 用 数字 化 的 光盘 来 
替代 传统 的 影像 磁带 ,因为 光盘 的 影像 质量 高 制造 成 本 低 、 可 长 时 间 保 存 、 在 商店 中 的 架子 
上 占用 的 空间 比较 小 ,而 且 不 需要 倒 带 。 娱 乐 性 电子 公司 希望 能 找到 合适 的 存储 介质 ,而 许 
多 计算 机 公司 也 想 在 其 软件 中 增加 多 媒体 特性 。 

这 3 个 市 场 广阔 而 又 能 量 巨大 的 行业 的 市 场 需 求 和 技术 的 结合 造就 出 了 DVD, 它 最 早 
是 数字 影像 盘 (Digital Video Disk) 的 缩写 ,但 现在 一 般 指数 字 多 用 途 盘 (Digital Versatile 
Disk) 。DVD 的 基本 设计 和 CD 相同 ,也 是 120mm 直径 的 注入 碳酸 盐 的 盘 模 ,由 激光 二 极 
管 照射 的 凸 区 和 凹 区 组 成 ,通过 光 接 收 器 读 入 信息 。 其 新 特性 有 : 

(1) 凹 区 更 小 CDVD 为 0. 4pm, 而 CD 为 0.8pmy) 。 

(2) 螺旋 线 更 紧凑 (DVD 道 间距 为 0.74ym, 而 CD 的 道 间 距 为 1. 6pm)。 

(3) 使 用 红色 激光 (DVD 激光 的 波长 为 0.65pm, 而 CD 的 为 0.78pm)。 

这 些 改进 使 DVD 的 容量 比 普通 光盘 提高 了 7 倍 ,达到 4. 7GB。 单 速 DVD 驱动 器 的 工 
作 速 度 为 1. 4MB/s( 而 CD 为 150KB/s)。 为 了 进一步 提高 存储 容量 ,DVD 定义 了 下 面 4 种 
格式 : 

(1) 单 面 单 层 (4.7GB) 。 

(2) 单 面 双 层 (8. 5GB) 。 

(3) 双 面 单 层 (9. 4GB) 。 

(4) 双 面 双 层 (17GB) 。 

双 层 技术 是 在 光盘 底层 有 一 层 反 射 层 ,上面 是 一 层 半 反射 层 。 根 据 激光 聚焦 在 哪 层 来 








外 部 疗 储 器 设备 


决定 反射 哪 一 层 。 为 提高 可 靠 性 ,需要 将 底层 的 止 区 和 凸 区 设计 得 稍微 大 一 些 , 所 以 其 容量 
比 上 层 要 稍微 小 一 些 。 

将 两 张 0. 6mm 厚 的 单 面 盘 的 背面 互相 粘 在 一 起 就 制 成 了 一 张 双 面 盘 。 为 使 所 有 格式 
的 盘 片 厚度 一 致 , 单 面 盘 也 是 由 0. 6mm 的 盘 片 后 面 粘 上 空白 底层 组 成 。 


9.4.5 Blu-Ray 


在 计算 机 行业 ,没有 任何 技术 能 一 直 保 持 住 其 地 位 ,存储 技术 也 不 例外 。DVD 刚刚 推 
出 不 久 , 一 种 新 的 技术 Blu-Ray 就 威胁 要 将 它 取 代 。 之 所 以 这 样 命名 ,是 因为 它 用 蓝 色 的 激 
光 取 代 了 DVD 用 的 红色 激光 。 蓝 色 激 光波 长 比 红色 的 要 短 ,这 就 使 它 可 更 精确 地 聚焦 ,能 
分 辨 出 更 小 的 是 区 和 四 区 。 单 面 的 Blu-Ray 盘 可 存放 大 约 25GB 的 数据 , 双 面 的 存储 容量 
约 50GB。 数 据 速率 约 为 4.5MB/s, 对 光盘 来 说 这 已 经 相当 不 错 ,但 与 磁盘 比 还 相差 很 远 。 
预计 Blu-Ray 最 终 将 完全 取代 CD-ROM 和 DVD, 但 这 个 过 程 将 持续 数 年 。 


本 章 内 容 小 结 和 学 习 方法 建议 


本 章 主要 讲解 磁盘 .光盘 等 外 部 存储 设备 。 从 设备 本 身 的 角度 ,给 出 了 这 些 设 备 的 基本 
组 成 和 读 写 的 原理 性 知识 。 从 计算 机 整 机 系统 的 高 度 来 看 ,还 涉及 这 些 设备 的 接口 线路 ,以 
及 设备 与 计算 机 总 线 的 连接 关系 。 从 功能 和 使 用 的 角度 来 看 , 讲 到 了 磁盘 阵列 技术 和 容错 、 
备份 和 热 插 拔 、 数 据 恢复 等 问题 。 本 章 内 容 中 属于 概念 和 一 般 了 解 的 知识 比较 多 。 


习题 与 思考 题 


1. 磁盘 设备 的 主要 技术 指标 有 哪些 ? 

2， 磁 记录 方式 指 的 是 什么 ” 有 哪 几 种 常用 的 编码 方式 ?” 各自 的 编码 效率 与 自 同步 能 
力 如 何 ? 
。 简单 说 明 硬 磁盘 驱动 器 的 组 成 。 
. 为 什么 格式 化 后 的 可 用 容量 会 比 可 存储 的 总 信息 位 少 了 许多 ? 
.简单 比较 温 式 硬盘 设备 和 常用 光盘 设备 在 使 用 场合 和 性 能 方面 的 同 异 之 处 。 
.简单 说 明 可 刻 光 盘 的 组 成 和 实现 数据 读 写 的 原理 性 过 程 。 

7. 只 读 光盘 、 可 刻 光 盘 、 可 擦 写 光盘 的 运行 原理 有 什么 不 同 ? 盘 表 面 的 材料 特性 有 什 
么 区 别 ? 

8. 为 什么 要 采用 磁盘 阵列 技术 ? 何 为 逻辑 盘 , 何 为 物理 盘 ? 作 为 一 个 逻辑 盘 使 用 的 多 
个 物理 盘 需 要 在 转速 和 所 用 扇 区 等 方面 严格 的 同步 吗 ? 为 什么 ? 

9. 什么 是 热 备份 磁 盘 ? 什么 叫 热 插 拔 技术 ? 

10. 阵列 磁盘 设备 应 用 什么 类 型 的 接口 卡 ? 该 接口 卡 上 大 体 有 些 什么 组 成 部 件 ? 阵列 
盘 中 的 RAID0,RAID1.RAID4 和 RAID5 指 的 是 什么 类 型 的 容错 功能 ? 
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本 章 和 下 一 章 的 教学 内 容 . 将 围绕 计算 机 输入 输出 系统 的 组 成 、 功 能、 运行 方式 .具体 使 
用 方法 等 为 主线 索 来 进行 组 织 。 计 算 机 输入 输出 系统 ,通常 由 计算 机 总 线 、 输 入 输出 接口 和 
输入 输出 设备 3 个 层次 的 逻辑 部 件 和 设备 共同 组 成 ,本 章 主 要 讲解 有 关 输 入 输出 设备 的 内 
容 。 有 关 计 算 机 总 线 、 输 入 输出 接口 以 及 输入 输出 方式 等 方面 的 知识 安排 到 下 一 章 讲解 。 
输入 输出 设备 又 称 计 算 机 的 外 围 设备 , 是 有 一 定 操作 功能 的 比较 完整 ,相对 独立 的 精密 
机 械 电子 装置 ,用 于 完成 面向 计算 机 操作 人 员 的 输入 输出 功能 。 当 前 的 计算 机 系统 中 ,输入 
输出 设备 的 种 类 繁多 ,功能 多 样 ,组 成 和 运行 原理 各 不 相同 ,本 章 只 选择 最 常用 、 最 基本 的 典 
型 设备 进行 简要 讲解 。 在 输出 设备 中 ,属于 显示 器 设备 的 ,重点 介绍 阴极 射线 管 显 示 器 、 液 
唱 显 示 器 ;属于 打印 机 设备 的 ,主要 讲解 针 式 打印 机 、 喷 墨 式 打印 机 和 激光 印字 机 。 在 输入 
设备 中 ,只 是 最 简单 地 介绍 一 下 计算 机 键盘 和 鼠标 器 的 运行 原理 。 本 章 的 内 容 , 一 般 叙 述 多 
于 深入 的 原理 性 知识 ,有 意识 地 避 开 设备 中 涉及 的 精密 机 械 、 光 学 、 流 体力 学 、 微 波 技 术 等 
知识 。 


10.1 输入 输出 设备 概述 


计算 机 应 用 的 普及 ,使 越 来 越 多 的 电子 设备 成 为 计算 机 的 输入 输出 设备 。 早 期 的 计算 
机 只 有 纸 带 、 穿 孔 机 等 外 部 设备 ,而 现在 以 键盘 .显示 器 或 者 它们 的 结合 即 终端 已 经 成 为 计 
算 机 的 标准 输入 输出 设备 ,而 硬盘 光盘 等 也 成 为 必 备 的 外 部 存储 设备 。 在 家 用 计算 机 领 
域 ,多 媒体 设备 ,如 DVD、 手 写 板 .语音 输入 和 数码 相机 也 逐渐 进入 了 计算 机 外 部 设备 的 大 
家 庭 。 总 之 ,计算 机 外 部 设备 正 向 着 种 类 繁多 、 功 能 丰富 .智能 化 的 方向 发 展 ,在 计算 机 组 成 
中 的 重要 性 也 逐渐 提高 。 图 10. 1 是 一 个 简单 的 输入 输出 设备 列表 。 


键盘 

输入 设备 图 形 输入 设备 : 鼠标 、 图 形 板 、 手 写 板 

图 像 输 入 设备 : 扫描 仪 、 传 真 机 、 数 码 相机 
条 形 码 阅读 器 

















显示 器 (字符 、 图 形 、 图 像 ) 
输出 设备 Mt 喷 墨 、 激 光 ) 























图 10.1 输入 输出 设备 列表 
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10.2 常用 的 输入 设备 


1. 键盘 

计算 机 键盘 是 用 于 手工 向 计算 机 送 入 操作 命令 、 源 程序 语句 、 运 行程 序 所 使 用 的 数据 等 
内 容 的 输入 设备 ,应 用 非常 普遍 。 计 算 机 键盘 由 机 械 部 分 和 电子 线路 部 分 组 成 ,并 通过 串 行 
接口 与 计算 机 主机 连接 ,向 CPU 送 入 所 项 击 按键 的 编码 。 

它 的 机 械 部 分 的 组 成 ,从 外 形 上 看 ,是 在 长 方形 的 部 件 上 以 横行 竖 列 位 置 关系 依 此 排放 
的 许多 按键 ,每 个 按键 上 用 字母 .文字 或 符号 标明 这 个 按键 的 含义 和 作用 。 这 些 按键 中 , 除 
了 字母 .数字 、 标 点 符号 数学 符号 等 基本 输入 按键 之 外 ,还 包括 一 些 编辑 功能 键 和 操作 控制 
键 ( 含 复合 用 按键 )。 从 内 部 看 ,每 个 按键 都 是 用 小 弹簧 支撑 着 ,按键 按 下 去 之 后 会 把 按键 上 
导电 件 与 其 下 面 金属 件 接触 上 ( 称 为 按键 闭合 ,实现 电信 号 连通 ), 松 开 手 之 后 ,小 弹簧 把 按 
键 顶 起 ,使 按键 与 其 下 面 金属 件 脱离 接触 (按键 松 开 , 实 现 电 信号 断 开 ) ,由 此 看 来 ,按键 相当 
于 一 个 机 械 开关 。 

它 的 电路 部 分 的 组 成 ,全 部 做 在 一 块 印 制 电 路 板 上 。 其 主要 功能 ,一 是 识别 按 下 的 是 哪 
一 个 按键 ,并 产生 出 该 按键 对 应 的 编码 信息 ;二 是 把 这 一 编码 从 并 行 格式 转换 成 串 行 格式 ， 
逐 位 传送 给 计算 机 主机 。 这 些 功能 是 用 板 上 的 一 个 专用 的 CPU 芯片 控制 完成 的 。 

识别 闭合 键 ,多 采用 行 扫描 法 完成 , 即 找 出 闭合 按键 在 按 行 列 关 系 布置 中 所 处 的 位 置 。 
具体 办 法 是 ,给 出 一 个 n 行 Xm 列 的 逻辑 电路 ,并 把 键盘 上 的 每 个 键 分 配 在 这 个 行 Xm 列 
的 交叉 点 位 置 ,如 图 10. 2 所 示 。 运 行 时 ,轮流 为 n 行 中 的 一 行 接 通 低 电位 ,其 他 行 给 高 电 
位 ,并 检查 m 列 的 各 列 的 电位 值 。 若 所 有 这 些 按键 都 未 按 下 ,都 处 于 断 开 状 态 , 则 每 一 列 都 
会 与 行 连通 ,不 管 行 上 有 高 或 低 电 位 ,所 有 列 的 电位 都 为 高 ,是 5V 电源 经 一 个 电阻 给 出 
的 。 若 只 有 一 个 键 按 下 , 即 进 入 闭合 状态 ,就 会 把 它 所 连接 的 行 线 和 位 线 连通 , 若 该 行 线 上 
为 低 电位 , 则 使 位 线 也 为 低 电 位 (5V 电源 的 电压 都 降 在 电阻 上 ) ,该 位 线 上 的 低 电位 与 其 他 
行 线 的 高 电位 被 相应 的 二 极 管 断 开 ,其 他 位 线 仍 为 高 电位 。 这 就 是 说 ,通过 一 个 行 线 和 列 线 
同时 为 低 电 位 (其 他 所 有 的 行 线 和 列 线 都 为 高 电位 ) 来 表明 一 个 闭合 键 的 位 置 。 再 用 行 线 和 
位 线 的 编码 去 查 表 , 就 得 到 闭合 按键 的 编码 值 。 在 具体 实现 中 ,对 行 线 和 位 线 的 控制 是 应 用 
并 行 接口 电路 完成 的 。 把 并 行 接口 的 输出 口 接 到 行 线 ,由 CPU 轮流 送出 只 有 一 位 为 0 值 、 
其 他 位 均 为 1 值 的 信号 ,而 把 列 线 接 到 并 行 接口 的 输入 口供 CPU 来 读 ,CPU 分 析 读 入 的 内 
容 以 判断 列 线 的 电位 情况 。 请 注意 ,这 里 说 的 CPU 是 指 键盘 线路 板 上 的 CPU ,而 不 是 计算 
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机 主机 的 CPU。 同 样 .用 行 线 和 位 线 的 编码 去 查 表 , 以 得 到 闭合 按键 的 编码 值 的 操作 也 是 
由 键盘 线路 板 上 的 CPU 完成 的 。 

键盘 的 具体 应 用 中 ,还 应 解决 抖动 和 组 合 按键 等 问题 。 抖 动 要 区 分 的 主要 是 键 被 按 下 
一 次 还 是 多 次 ,组 合 键 要 用 于 判断 是 合法 组 合 还 是 非法 组 合 ,合法 组 合 ( 如 Shift 键 和 字符 
键 ) 要 能 正确 响应 ,非法 组 合 要 能 给 出 出 错 信息 。 

键盘 通常 都 通过 串 行 接口 与 计算 机 主机 连接 ,把 项 击 的 键 的 编码 逐 位 送 到 主机 一 端的 
串 行 接口 中 ,由 主机 一 端的 串 行 接口 完成 串 行 格式 到 并 行 格式 的 转换 , 供 主机 CPU 读 取 。 

2. 鼠标 

鼠标 是 随 着 图 形 用 户 界 面 出 现 的 输入 设备 。 图 形 界面 的 出 现 使 计算 机 的 易 用 性 大 为 增 
强 , 也 使 更 多 的 对 计算 机 工作 原理 一 无 所 知 的 人 成 为 计算 机 用 户 , 他 们 希望 能 有 在 图 形 界面 
上 进行 点 击 的 设备 ,这 就 是 鼠标 产生 的 原因 。 

从 感应 方式 看 ,主要 有 3 种 类 型 的 鼠标 : 机 械 式 、 光 学 式 和 光电 式 。 机 械 式 鼠 标 内 部 有 
两 个 轴 互 相 重 直 的 小 轮 , 底 部 有 一 个 橡胶 球 。 当 鼠标 移动 时 橡胶 球 进行 旋转 ,通过 摩擦 带动 
两 个 小 轮 进行 转动 ,每 个 轮子 各 驱动 一 个 可 变 电 阻 。 通 过 测量 电阻 值 的 变化 ,就 可 以 得 到 鼠 
标 在 每 个 方向 上 的 位 移 。 

光学 式 鼠 标底 部 没有 轮子 ,也 没有 球 , 而 是 由 一 个 发 光 二 极 管 和 一 个 光 检 测 器 代替 。 光 
学 鼠标 下 面 必 须 是 一 个 特制 的 鼠标 垫 ,鼠标 垫上 是 距离 很 近 的 线条 组 成 的 矩形 格 。 随 着 鼠 
标 在 垫子 上 移动 , 光 检测 器 根据 从 LED 反射 回 的 光线 总 量 的 变化 来 感知 鼠标 越过 了 线条 ， 
鼠标 内 部 的 逻辑 电路 可 以 计算 出 每 个 方向 上 移动 的 格 数 , 计 算 鼠 标的 位 移 。 

光电 式 鼠 标 和 新 式 的 机 械 式 鼠 标 类 似 , 底 部 是 一 个 可 以 绕 互 为 垂直 的 两 个 轴 旋 转 的 小 
球 。 两 个 轴 上 连 有 译 码 器 ,上 面 有 光线 可 以 通过 的 小 裂缝 。 鼠 标 移动 时 ,带动 轴 旋 转 , 当 裂 
颖 正好 位 于 LED 和 检测 器 之 间 时 ,检测 器 可 以 感知 到 一 个 光 脉 冲 。 脉 冲 数 和 鼠标 的 位 移 成 
正比 ,对 脉冲 计数 后 就 可 以 得 到 鼠标 的 位 移 。 

虽然 对 位 移 的 感知 方式 各 不 相同 .但 每 种 鼠标 在 移动 一 个 最 小 位 移 单位 后 ,都 将 向 计算 
机 发 送 一 个 3 字 节 的 串 。 一 般 情况 下 ,这 个 串通 过 串 行 接口 进入 计算 机 。 第 一 个 字 节 是 一 
个 有 符号 整数 ,表示 鼠标 在 最 后 的 100ms 在 工 方向 上 的 移动 量 ;第 二 个 字 节 与 其 类 似 ,表示 
的 是 > 方向 的 位 移 量 ;第 三 个 字 节 描述 鼠标 当前 键 的 状态 。 有 时 ,两 个 坐标 方向 的 位 移 量 
各 需要 用 2 个 字 节 表示 。 

当 这 些 字 节 送 到 计算 机 中 后 ,计算 机 的 底层 软件 接收 这 些 信息 , 并 将 相对 位 移 量 转换 成 
鼠标 的 绝对 位 置 .然后 在 屏幕 上 对 应 位 置 显示 一 个 箭头 来 表示 鼠标 的 当前 位 置 。 当 箭头 指 
向 正确 的 菜单 项 时 ,如 果 用 户 按 下 鼠标 上 的 键 ,计算 机 就 可 以 从 箭头 在 屏幕 上 的 位 置 计 算出 
哪个 菜单 项 已 被 用 户 选择 ,然后 执行 用 户 所 和 希望 完成 的 工作 。 


10.3 常用 的 输出 设备 


10.3.1 点 阵 式 输出 设备 基本 原理 


计算 机 程序 的 运行 结果 和 中 间 过 程 ,都 需要 输出 设备 提供 给 用 户 。 最 常用 的 输出 设备 
有 显示 器 和 打印 机 。 这 两 类 输出 设备 基本 上 都 是 以 点 阵 方式 运行 的 ,通常 都 是 期 望 把 某 些 
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信息 ,例如 字形 .图形 ,图像 等 ,以 计算 机 用 户 可 见 的 某 种 形式 表示 出 来 。 在 计算 机 显示 器 屏 
莫 上 ,这 些 被 显示 的 内 容 , 是 以 可 见 光 形式 表现 出 来 的 ;而 在 打印 纸 上 , 通 常 是 以 “印刷 ”( 染 
色 ) 的 效果 表现 出 来 的 。 它 们 共同 的 特点 是 ,要 表示 的 信息 ,最 终 要 以 平面 上 的 各 种 可 见 的 
“形状 ”体现 出 来 ,而 这 些 “ 形 状 ” ,不 管 其 简单 还 是 复杂 ,在 原理 上 又 都 是 以 许多 断 续 的 点 的 
不 同 布局 表示 出 来 的 , 当 一 些 点 彼此 之 间 靠 得 很 近 的 时 候 , 使 人 看 上 去 就 好 像 连接 在 一 起 的 
样子 。 

以 点 阵 方式 运行 的 设备 重点 解决 的 问题 是 要 设法 找 出 组 成 各 种 形状 的 点 的 布局 规律 ， 
以 及 在 有 关 的 输入 输出 设备 中 ,如 何 针对 这 些 规律 把 这 些 点 显现 出 来 。 从 组 成 各 种 形状 的 
点 的 布局 规律 来 看 ,大 体 有 两 种 情况 。 第 一 种 情况 是 ,每 个 被 表示 的 对 象 有 确定 的 形状 ,如 
中 、 西 文字 符 , 标 点 符号 ,数学 运算 符号 等 ,更 进一步 说 ,一 些 简 单 的 几何 形状 也 可 以 用 符合 
某 种 规律 布局 的 一 些 点 表示 出 来 ,如 直线 、 圆 、 和 矩形 等 。 在 需要 表示 这 样 一 些 对 象 ( 呈 现 它们 
的 形状 ) 时 ,例如 要 表示 字符 ,就 可 以 事先 用 某 种 办 法 把 这 些 字符 的 点 的 布局 设计 保存 在 存 
储 器 中 ,需要 时 再 把 它们 复 现 出 来 ,这 是 在 字符 类 型 设备 中 常用 的 办 法 。 另 一 种 情况 是 ,组 
成 被 表示 对 象 的 点 的 布局 没有 确定 的 规律 可 言 , 例 如 一 幅 图 像 到 了 计算 机 内 也 得 被 表示 成 
由 许多 点 组 成 的 方 阵 格式 ,图 像 的 内 容 就 变 成 在 一 个 确定 的 平面 范围 内 通过 摆 放 上 许多 相 
应 的 点 来 加 以 表示 ,此 时 这 个 方 阵 中 哪些 位 置 上 有 点 ,哪些 位 置 上 无 点 ,完全 是 由 图 像 本 身 
的 内 容 决 定 的 。 这 些 点 布局 规律 的 不 确定 性 决定 了 在 具体 的 处 理 中 需要 记忆 该 画面 上 对 应 
每 一 个 点 的 位 置 上 有 无 点 的 实际 情形 。 问 题 处 理 的 焦点 ,就 变 成 如 何 把 图 像 上 所 表现 的 连 
续 变 化 的 内 容 , 在 计算 机 设备 的 指定 的 平面 上 用 离散 的 点 表示 出 来 ,如 何 表示 的 更 真实 准 
确 , 这 正 是 图 像 处 理 领域 要 解决 的 问题 。 

前 面 的 讨论 只 限于 用 点 有 无 的 形式 来 表示 “形状 ”, 届 于 最 简单 的 应 用 方式 。 很 容易 想 
到 ,为 每 一 个 点 分 配 一 个 二 进 制 的 位 (bit) 就 可 以 区 别 出 点 的 有 无 。 例 如 ,用 该 bit 的 值 为 1 
表示 相应 位 置 上 有 一 个 点 ,该 bit 的 值 为 0 表示 相应 位 置 上 没有 点 。 这 样 ,一 个 平面 范围 内 
的 全 部 点 的 布局 情形 ,就 可 以 用 一 长 串 二 进 制 数 位 组 成 的 数据 结构 来 表示 ,或 许 将 这 一 长 串 
二 进 制 数位 ,组 织 成 一 个 二 维 数组 的 形式 ,以 方便 找 出 二 维 数组 中 的 一 个 二 进 制 数 位 与 平面 
中 一 个 具体 位 置 的 对 应 关系 。 

在 实际 应 用 中 往往 还 必须 解决 其 他 方面 的 许多 使 用 要 求 , 才 能 使 上 述 思路 达到 更 高 的 
应 用 标准 。 例 如 ,对 这 些 点 安排 得 多 密 才 更 为 合理 ,显而易见 ,安排 更 密 的 点 可 以 把 要 表示 
的 形状 呈现 得 更 精细 准确 ,但 表示 同样 大 小 的 形状 用 到 的 数据 量 会 更 多 ,对 输入 输出 设备 的 
处 理 精 度 要 求 也 越 高 。 此 外 ,还 需要 找 出 记忆 与 处 理 一 幅 图 各 处 不 同 的 亮 暗 层次 或 不 同 颜 
色 的 办 法 ,对 字符 也 有 用 不 同 深浅 程度 或 不 同 颜色 表示 的 使 用 要 求 。 对 显示 器 而 言 ,在 使 用 
单一 颜色 的 情况 下 ,只 能 用 各 处 的 不 同 亮度 (深浅 程度 ,通常 被 称 为 灰 度 级 ) 来 体现 一 幅 图 的 
层次 感 , 即 每 个 点 可 以 用 几 种 不 同 的 亮度 显示 。 此 时 ,为 表示 一 个 点 ,就 不 能 只 用 一 个 二 进 
制 位 ,而 要 用 多 个 二 进 制 位 ,例如 5b 位 ,具体 位 数 5b 取决 于 显示 的 亮度 等 级 数 S, 其 关系 是 
5S 二 2, 亮度 等 级 越 多 .用 于 表示 一 幅 同 样 大 小 的 图 的 数据 量 也 就 越 大 。 在 使 用 多 种 颜色 的 
情况 下 ,不 同 的 颜色 是 用 规定 的 3 种 基本 颜色 按 不 同 的 比例 关系 混合 而 呈现 出 来 的 ,对 彩色 
显示 器 或 彩色 的 打印 机 都 是 如 此 。 为 此 ,要 求 每 个 点 都 可 以 呈现 不 同 的 颜色 ,为 表示 256 种 
颜色 ,要 用 8 个 二 进 制 位 ,车 希望 对 每 种 基本 颜色 都 有 256 种 亮度 . 则 表示 每 一 个 点 要 用 24 
个 二 进 制 位 , 即 3 个 字 节 (B) ,每 一 个 点 就 可 以 有 256 X256 X256 种 颜色 ,通常 被 称 为 无 限 
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种 颜色 ,也 被 称 为 真 彩色 。 此 时 ,为 了 表示 一 幅 由 1024X768 个 点 组 成 的 图 ,需要 使 用 1024 
X768X3 个 字 节 的 数据 量 。 

上 述 的 内 容 , 只 是 点 阵 式 设备 的 基本 运行 原理 中 的 简单 概念 ,要 把 它 在 真正 的 设备 中 实 
现 出 来 ,还 有 许多 技术 方面 的 问题 要 具体 解决 。 首 先 把 这 些 设备 中 用 到 的 属于 共同 性 的 知 
识 说 明 清 楚 ,不 但 可 以 减少 介绍 不 同 设备 运行 原理 过 程 中 的 重复 性 叙述 ,而 且 对 深入 理解 这 
些 知 识 也 大 有 好 处 。 


10.3.2 显示 器 的 组 成 和 运行 原理 


显示 器 设备 是 以 可 见 光 形式 显示 信息 的 输出 设备 。 当 前 使 用 最 多 的 是 以 阴极 射线 管 
(Cathode Ray Tube ,CRT) 为 主体 的 显示 器 ,其 次 是 液晶 显示 器 (Liquid Crystal Display,LCD) 。 
从 它们 显示 的 内 容 区 分 ,有 以 显示 字符 为 主 的 字符 显示 器 ,通常 也 兼 有 显示 一 般 质 量 的 图 形 、 
图 像 的 功能 ,也 有 以 显示 高 质量 的 图 形 为 主 的 图 形 显示 器 ,二 者 的 复杂 程度 和 价格 相差 较 大 。 
目前 的 计算 机 系统 中 ,通常 使 用 的 是 一 般 的 显示 器 ,又 称 监视 器 (Monitor) ,结构 上 大 体 是 一 台 
没有 高 频 放大 部 分 的 电视 机 ,本 身 还 算 不 上 一 台 完 整 、 独 立 的 设备 ,因为 它 的 控制 器 部 分 被 分 
离 出 来 ,并 且 用 插 接 在 主机 中 的 一 块 显示 卡 实现 ,通过 显示 卡 向 显示 器 传送 视频 信号 。 

显示 器 设备 是 属于 以 点 阵 方式 运行 的 典型 设备 。 显 示 的 内 容 以 可 见 光 形 式 呈 现在 显示 
器 的 显示 屏幕 上 。 显 示 屏 幕 是 一 个 矩形 的 平面 装置 , 它 的 大 小 习惯 上 用 其 对 角 线 的 长 度 表 
示 ,使 用 英寸 为 长 度 单位 ,常用 的 有 15 英寸 .17 英寸 .19 英寸 .21 英寸 等 不 同 尺 寸 。 为 实现 
显示 , 沿 水 平和 垂直 两 个 方向 把 屏幕 分 成 许多 小 的 区 域 , 一 个 小 的 区 域 对 应 一 个 发 光 点 ,每 
个 发 光 点 称 为 一 个 像素 ,一 个 屏幕 上 所 提供 的 全 部 像素 的 数目 被 称 为 分 辩 率 ,常用 的 有 
800X600、1024X768、1280X1024、1600X1200 等 多 种 分 辩 率 , 它 与 屏幕 的 尺寸 和 像素 之 间 
的 距离 有 关 , 像 素 之 间 的 距离 多 为 0. 31mm 或 0.28mm。 显 示 器 有 单 色 和 彩色 两 种 ,在 单 色 
显示 器 中 ,是 用 所 显示 内 容 的 亮 暗 程度 , 即 灰 度 级 (Gray Level) ,来 表现 显示 内 容 的 层次 感 ; 
彩色 显示 器 则 可 以 用 比较 真实 的 颜色 来 显示 一 个 对 象 的 形状 和 颜色 ,一 台 彩 色 显 示 器 所 能 
提供 的 颜色 种 类 ,通常 可 以 在 系统 中 进行 设置 ,颜色 种 类 越 多 ,表现 力 更 强 ,但 为 表示 同一 个 
对 象 所 占用 的 存储 器 容量 要 更 大 。 

1. 阴极 射线 管 显 示 器 

阴极 射线 管 显示 器 是 目前 使 用 最 广泛 的 显示 器 件 , 最 早 用 于 电视 接收 机 ,然后 用 于 计算 
机 系统 ,作为 字符 、 图 形 和 图 像 显 示 器 。 阴 极 射 线 管 是 一 个 漏斗 形 的 电 真空 器 件 ,由 显示 屏 、 
电子 枪 和 偏转 控制 装置 3 部 分 组 成 ,如 图 10.3 所 示 。 
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显示 屏 是 显示 信息 的 主体 部 分 ,由 玻璃 屏 和 涂 在 其 内 壁 的 荧光 粉 薄 层 构成 ,这 层 荧光 粉 
可 在 电子 柬 撞击 下 发 出 不 同 颜色 和 亮度 的 光 点 。 为 了 在 显示 屏 上 显示 信息 ,必须 有 为 其 提 
供电 子 束 和 选择 电子 束 在 屏幕 上 撞击 位 置 的 相关 部 件 。 

电子 枪 是 用 于 产生 电子 东 的 部 件 , 由 灯丝 、 阴 极 、 栅 极 、 阳 极 、 聚 焦 极 几 部 分 组 成 。 灯 丝 
在 通电 之 后 产生 热量 ,使 阴极 被 加 热 , 变 热 的 阴极 会 释放 出 大 量 的 电子 ; 栅 极 用 于 控制 这 些 
电子 通过 栅 极 进 入 阳极 区 域 ,进而 撞 向 显示 屏 的 电子 的 数量 , 即 打 向 显示 屏 的 电子 东 的 强 
弱 ; 阳 极 实现 对 电子 束 的 加 速 , 确 保 电 子 束 有 足够 的 动能 ,以 提高 显示 屏 的 显示 亮度 ;聚焦 极 
用 于 对 电子 束 进行 聚焦 ,把 原来 初速 不 等 .方向 不 尽 相 同 的 电子 聚焦 成 很 细 的 一 个 电子 束 ， 
以 便 打 到 显示 屏 上 能 形成 一 个 很 小 的 亮点 ,保证 较 高 的 显示 清晰 度 。 

偏转 控制 装置 是 指 套 在 阴极 射线 管 尾 部 的 偏转 线圈 ,用 于 控制 电子 东 沿 着 水 平和 垂直 
两 个 方向 的 运动 轨迹 ,以 便 准确 地 控制 一 东 电 子 能 打 到 显示 屏幕 上 任何 一 个 位 置 ,这 是 在 显 
示 屏 幕 上 全 屏 显示 信息 所 必须 实现 的 控制 功能 。 

对 彩色 显示 器 ,显示 的 颜色 应 由 红 、 绿 、 蓝 3 种 基本 颜色 按 一 定 比例 关系 搭配 而 成 。 为 
此 ,对 显示 屏 上 的 每 一 个 像素 ,都 要 由 能 在 电子 束 照射 下 发 出 红 、 绿 、 蓝 3 种 颜色 的 3 个 小 荧 
光 粉 点 组 成 ,可 以 把 它们 排列 成 正三 角形 状 , 再 为 它们 各 配备 一 个 独立 控制 电子 束 强 度 的 电 
子 枪 ,并 确保 3 个 电子 枪 发 出 的 电子 束 能 准确 地 打 在 各 自 对 应 的 小 荧光 粉 点 上 。 为 此 ,3 个 
电子 枪 也 要 排列 成 正三 角形 状 , 并 在 荧光 屏 附 近 安 装 一 个 布 满 小 孔 的 荫 单 板 , 其 小 孔 数 与 3 
色 荧 光 粉 点 的 组 数 ( 单 色 时 的 像素 数 ) 一 致 ,以 确保 3 个 电子 枪 发 出 的 电子 东 能 穿 过 同一 小 
孔 分 别 打 在 各 自 对 应 的 小 荧光 粉 点 上 。 

电子 束 在 显示 屏 上 按 某 种 轨迹 运动 被 称 为 扫描 ,控制 电子 束 扫描 轨迹 的 电路 被 称 为 扫 
描 控制 逻辑 部 件 ,常用 的 扫描 方式 有 光栅 扫描 (Raster Scan) 和 随机 扫描 (Random Scan) 两 
种 ,二 者 的 性 能 和 价格 差异 较 大 。 在 光栅 扫描 方式 下 ,电子 东 要 从 左 到 右 、 从 上 到 下 扫描 整 
个 屏幕 ,扫描 控制 本 身 不 必 区 分 什么 位 置 上 有 点 要 显示 ,什么 位 置 上 无 点 不 显示 , 它 只 是 控 
制 电子 束 在 整个 屏幕 上 重复 移动 ,显示 的 具体 内 容 则 通过 另外 的 逻辑 线路 提供 。 在 这 一 扫 
描 方式 下 ,有 逐 行 扫描 和 隔行 扫描 两 种 方案 , 逐 行 扫描 是 从 屏幕 顶端 开始 ,依次 连续 扫描 所 
有 各 行 ,隔行 扫描 是 这 次 只 扫描 行 号 为 奇数 的 全 部 各 行 ,下 次 再 扫描 行 号 为 偶数 的 全 部 各 
行 。 电 视 中 普遍 采用 的 是 隔行 扫描 技术 。 由 于 光栅 扫描 与 电视 系统 使 用 相同 的 技术 ,技术 
成 熟 性 好 ,产品 价格 便宜 ,被 广泛 地 用 在 计算 机 的 显示 器 中 。 它 的 缺点 是 扫描 宛 余 时 间 多 ， 
分 辩 率 较 低 , 故 主要 用 于 普及 型 的 字符 显示 器 。 在 随机 扫描 方式 下 .电子 束 只 扫描 在 屏幕 上 
有 显示 内 容 的 位 置 ,而 不 是 整个 屏幕 ,所 以 这 种 扫描 方式 画图 速度 快 , 分 辩 率 高 , 故 主要 用 于 
高 质量 的 图 形 显示 器 。 其 缺点 是 , 它 的 扫描 控制 逻辑 比较 专用 、 复 杂 ,产品 生产 批量 不 够 大 ， 
价格 较 高 。 

电子 东 打 在 荧光 粉 上 发 出 的 光 所 持续 的 时 间 ,被 称 为 余辉 时 间 。 余 辉 时 间 的 长 短 ,主要 
取决 于 荧光 粉 材料 的 特性 ,显示 器 中 通常 使 用 余辉 时 间 比 较 短 的 这 一 种 。 为 了 在 屏幕 上 有 
稳定 的 .至 少 人 们 看 上 去 无 明显 闪烁 感 的 画面 .就 要 把 显示 的 内 容 不 断 重复 显示 ,一 般 来 讲 
ls 要 重复 扫描 整个 显示 屏幕 60 一 100 次 .这 正 是 扫描 控制 逻辑 应 完成 的 控制 功能 。 

2. 液晶 显示 器 

CRT 显示 器 经 过 长 期 的 发 展 ,技术 成 熟 .成 像 质 量 也 高 ,使 用 十 分 普及 。 但 由 于 其 体积 
大 , 耗 电量 高 ,显然 不 适合 移动 计算 环境 。 目 前 ,在 笔记 本 计算 机 上 得 到 广泛 应 用 的 是 液晶 
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显示 器 ,而 且 , 随 着 液晶 技术 的 发 展 ,成 像 质量 不 断 提高 ,加 之 液晶 显示 器 低能 耗 、 低 辐射 的 
特点 ,使 它 大 有 与 CRT 显示 器 抗衡 的 趋势 。 

液晶 是 一 种 胶 状 的 有 机 分 子 , 可 以 像 液 体 一 样 流动 ,但 又 有 像 水 晶 一 样 的 空间 结构 ,是 
1888 年 由 一 位 澳大利亚 的 植物 学 家 发 现 的 .并 在 19 世纪 60 年 代 被 首次 用 来 做 显示 器 (如 
计算 器 .手表 ) 。 当 液晶 的 所 有 分 子 都 朝 一 个 方向 排列 起 来 , 它 的 光学 性 质 将 取决 于 光 进 入 
的 方向 和 光 的 偏振 性 。 使 用 特定 的 电场 ,可 将 液晶 分 子 重新 排列 ,也 就 可 以 改变 其 光学 性 
质 。 更 为 独特 的 是 ,用 光照 射 液晶 ,透射 光 的 强度 可 以 用 电场 控制 。 液 晶 的 这 种 属性 可 以 用 
来 开发 平面 显示 器 。 

图 10.4 给 出 了 LCD 显示 器 原理 的 示意 图 。 图 10. 4(a) 给 出 了 LCD 的 一 般 构造 ,LCD 
显示 器 的 屏幕 由 两 块 平行 的 玻璃 中 间 夹 着 一 层 密封 的 液晶 组 成 ,两 块 玻璃 分 别 连 着 透明 的 
电极 。 后 面 那 块 玻璃 之 后 有 一 东 光 线 (自然 光 或 人 造 光 ) 照 射 到 屏幕 上 , 连 在 玻璃 上 的 透明 
电极 用 来 在 液晶 中 产生 电场 ,用 不 同 的 电压 加 在 屏幕 不 同 的 位 置 ,控制 显示 的 图 形 。 粘 在 前 
后 两 块 玻璃 板 上 的 是 人 造 偏 光板 ,因为 液晶 显示 技术 要 求 使 用 偏振 光 。 

液晶 
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虽然 目前 有 多 种 LCD 显示 器 ,但 我 们 还 是 以 绞 合 向 列 型 (Twisted Nematic,TN) 显 示 
器 为 例 进 行 介绍 。 这 种 类 型 的 显示 器 后 玻璃 板 上 有 许多 微小 的 水 平 槽 ,前 玻璃 板 上 有 一 些 
微小 的 竖 直 槽 ,如 图 10.4(b) 所 示 。 没 有 电场 存在 时 ,液晶 分 子 将 顺 着 槽 排列 。 由 于 前 后 玻 
璃 板 的 槽 互相 垂直 ,所 以 液晶 分 子 ( 同 时 导致 晶体 结构 ) 从 后 到 前 将 从 水 平 到 竖 直 变化 。 

显示 器 后 面 是 一 块 水 平 偏振 板 , 只 允许 水 平 偏振 光 通 过 。 显 示 器 前 面 是 垂直 偏振 板 , 只 
人 允许 垂直 偏振 光 通 过 。 如 果 中 间 没 有 液晶 的 话 , 从 后 面 进来 的 水 平 偏振 光 将 被 前 面 的 垂直 
偏振 板 完 全 阻碍 ,使 屏幕 一 片 漆黑 。 

但 是 ,有 处 于 中 间 的 液晶 分 子 进行 引导 ,光线 将 转变 其 极 性 ,完全 成 为 垂直 偏振 光 。 这 
样 ,如 果 没 有 电场 控制 .LCD 显示 器 上 也 将 是 一 片 光 亮 。 通 过 在 选 定 的 位 置 加 上 一 定 的 电 
压 , 液 晶 的 结构 将 被 破坏 ,阻碍 那个 位 置 的 光线 通过 ,将 使 该 位 置 变 黑 。 

一 般 有 两 种 方式 提供 电压 。 在 廉价 的 被 动 矩阵 显示 器 上 ,两 个 电极 上 都 是 平行 的 导线 。 
例如 ,在 640X480 的 显示 器 上 ,后 面 的 电极 上 可 能 是 640 根 垂直 的 导线 ,前面 也 许 是 480 根 
水 平 的 。 通 过 在 某 根 垂直 导线 上 加 上 电压 后 ,再 在 某 根 水 平 导 线 上 来 一 个 脉冲 ,两 根 导 线 交 
又 点 的 电压 将 被 改变 ,使 该 点 短暂 变 黑 。 在 下 个 点 和 下 下 个 点 上 重复 这 个 脉冲 ,一 条 黑 线 就 
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画 出 来 了 ,与 CRT 的 工作 原理 类 似 。 正 常情 况 下 .整个 屏幕 将 在 1s 内 重 画 60 次 或 者 更 多 
次 ,使 眼睛 觉得 屏幕 上 有 一 个 固定 的 图 形 . 这 也 和 CRT 的 工作 方式 一 样 。 

另 一 种 广泛 使 用 的 方式 是 主动 矩阵 显示 器 。 它 相对 来 说 昂贵 一 些 , 但 成 像 质量 也 要 好 
一 些 。 它 不 但 有 两 组 互相 垂直 的 导线 ,在 其 中 的 一 个 电极 的 每 个 像素 位 置 上 还 有 一 个 微型 
开关 。 通 过 打开 或 关闭 这 些 开关 ,可 以 在 屏幕 上 产生 跃 变 电 压 ,也 就 在 屏幕 上 产生 跃 变 点 
阵 。 这 些微 型 光 管 被 称 为 薄膜 晶体 管 (Thin Film Transistor, TFT), 采 用 这 种 技术 的 平面 
显示 器 也 常 被 称 为 TFT 显示 器 。 目 前 ,大 多 数 笔记 本 计算 机 以 及 许多 桌面 计算 机 配置 的 独 
立 的 平面 显示 器 使 用 的 都 是 TFT 技术 。 

上 面 我 们 简单 描述 了 单 色 液 晶 显 示 器 的 工作 原理 。 可 以 说 彩色 液晶 显示 器 在 原理 上 和 
单 色 液晶 显示 器 基本 相同 ,但 细节 上 要 复杂 得 多 。 彩 色 液 晶 显 示 器 中 在 屏幕 上 的 每 个 点 阵 
用 光 过 滤器 将 白光 分 解 成 红 、 绿 、 蓝 三 原色 ,并 使 它们 能 独立 显示 出 来 ,通过 它们 的 线性 组 
合 , 就 可 以 创造 出 屏幕 上 的 万 紫 千 红 的 各 种 颜色 。 

CRT 显示 器 和 TFT 显示 器 每 秒 钟 都 必须 刷新 60 一 100 次 ,以 获得 稳定 的 显示 质量 。 
这 些 用 来 刷新 的 数据 被 存放 在 显示 控制 卡 上 的 专用 存储 器 一 显示 存储 器 (Video RAM) 
中 。 显 示 存 储 器 中 存放 有 代表 一 屏 或 多 屏 显 示 的 位 图 数据 。 例 如 ,对 一 个 有 1600X1200 个 
像素 的 屏幕 ,显存 中 应 存放 1600X1200 个 数值 ,每 个 数值 对 应 一 个 像素 。 实 际 上 ,显存 中 存 
放 着 好 几 个 这 样 的 位 图 数据 ,以 实现 不 同 屏 幕 图 像 的 快速 切换 。 

高 端 显示 器 中 ,每 个 像素 被 表示 为 3 字 节 的 RGB 值 , 每 个 字 节 分 别 用 来 表示 该 像素 点 
的 红 、 绿 、 蓝 颜色 的 亮度 。 根 据 物理 规律 ,任何 颜色 都 可 以 通过 红 、 绿 、 蓝 3 种 光 进 行 线性 组 
合 获 得 。 对 于 1600X1200 分 辩 率 的 显示 器 来 说 ,如 果 每 个 像素 点 用 3 字 节 表示 , 则 其 显存 
需要 接近 5.5MB 的 容量 来 存放 图 像 信息 ,同时 ,对 图 像 的 任何 动作 都 需要 花费 CPU 相当 多 
的 时 间 。 位 图 显示 器 对 带宽 要 求 也 很 高 。 为 在 1600X 1200 分 辩 率 的 显示 器 显示 全 屏幕 、 全 
彩色 的 多 媒体 图 像 , 就 要 求 在 显示 一 帧 图 像 的 时 间 内 ,复制 5. 5MB 的 数据 到 显示 存储 器 中 。 
对 全 动画 的 图 像 ,每 秒 要 显示 至 少 25 帧 ,总 的 数据 传输 率 要 达到 137. 5MB/s。 这 种 带宽 要 
求 远 不 是 (E)ISA 总 线 所 能 达到 的 ,甚至 也 超过 了 最 初 的 PCI 总 线 的 传输 能 力 (127. 2MB/ 
s) ,带宽 始终 是 一 个 大 问题 。 

为 使 CPU 到 显存 的 带宽 得 到 提高 ,从 Pentium [开始 ,Intel 增加 了 一 条 新 的 图 形 加 速 
端口 总 线 (Accelerated Graphics Port,AGP) 来 支持 显存 数据 的 传输 。AGP 总 线 以 66MHz 
的 频率 传输 32 位 的 数据 ,带宽 达到 了 252MB/s。 为 支持 更 高 交互 度 的 图 形 ,后 续 的 AGP 
总 线 版 本 以 2.4, 甚 至 是 8 倍速 的 速度 ,来 提供 足够 的 带宽 ,并 不 增加 PCI 主 总 线 的 负载 。 


10.3.3 打印 机 的 组 成 和 运行 原理 


打印 机 是 最 常用 的 输出 设备 , 它 把 计算 机 输出 的 信息 打印 在 纸 上 , 可 以 较 长 时 间 保 存 。 
打印 机 多 用 RS-232 串 行 接口 或 通用 并 行 接口 与 计算 机 主机 相连 。 随 着 USB 接口 在 个 人 计 
算 机 中 的 普遍 使 用 ,现在 的 打印 机 基本 上 都 支持 USB 接口 。 目 前 常用 的 打印 机 有 针 式 打印 
机 、 喷 墨 式 打印 机 激光 式 打印 机 等 多 种 .其 中 大 多 数 只 以 一 种 颜色 打印 ,但 也 有 一 些 支持 彩 
色 打 印 , 它 们 都 属于 以 点 阵 方式 执行 输出 功能 的 设备 。 

可 以 从 不 同 的 角度 对 打印 机 进行 分 类 。 从 打印 方式 的 角度 ,可 以 把 打印 机 分 成 击 打 式 
和 非 击 打 式 , 击 打 式 又 被 分 为 点 阵 针 式 和 活字 式 两 种 。 击 打 式 是 通过 打印 的 机 械 装置 撞击 
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色 带 以 便 把 字形 染 印 在 纸 上 ,活字 打印 机 的 打印 的 机 械 装置 是 多 个 刻 有 文字 的 小 * 锤 ,类 似 
于 日 常 手工 打字 的 英文 打字 机 , 它 只 适用 于 字符 集 很 小 的 文字 ,如 英文 ,要 很 好 地 打印 中 文 
汉字 就 有 困难 ,更 无 法 支持 打印 图 形 和 图 像 ; 针 式 打印 机 的 打印 的 机 械 装置 是 多 个 用 电磁 铁 
控制 的 打印 针 , 通 过 组 合 这 些 针 可 以 形成 由 点 阵 构成 的 随意 的 形状 , 故 它 可 以 用 于 打印 多 种 
语言 的 文字 、 图 形 和 图 像 ,通用 性 强 。 击 打 式 打印 机 打印 速度 慢 ,噪声 大 ,打印 质量 一 般 。 非 
击 打 式 打印 机 则 是 通过 静电 、 喷 墨 等 非 机 械 撞 击 方式 完成 在 纸 上 着 色 ,打印 速度 快 ,噪声 低 ， 
打印 质量 高 ,易于 实现 彩色 打印 ,普及 型 的 哮 墨 打印 机 和 激光 打印 机 得 到 广泛 应 用 ,高 档 的 
激光 打印 机 在 电子 照排 印刷 系统 中 得 到 普遍 应 用 。 

1. 针 式 打印 机 

针 式 打印 机 属于 点 阵 式 打印 机 ,价格 低廉 ,功能 可 靠 , 但 速度 不 高 ,噪声 较 大 而 且 图 形 打 
印 效果 很 差 。 目 前 主要 有 3 种 用 途 , 第 一 是 用 来 打印 一 些 大 张 的 表格 ;第 二 是 适合 打印 一 些 
小 片 的 纸张 ,如 现金 收据 .ATM 或 信用 卡 的 交易 记录 以 及 登 机 有 牌 等 ;第 三 是 用 在 用 碳 蓝 纸 
一 次 输出 多 份 打印 结果 的 场合 。 针 式 打 印 机 由 走 纸 机 构 、 色 带 机 构 、 打 印 头 和 一 些 迎 辑 电 路 
等 几 部 分 组 成 ,如 图 10. 5(a) 所 示 。 

(1) 走 纸 机 构 由 步 进 电机 驱动 走 纸 , 有 奈 轮 摩擦 走 纸 和 链 式 纸 孔 走 纸 两 种 驱动 方式 ,每 
打印 完 一 行 字符 , 走 纸 机 构 带 动 打 印 纸 走 一 定 距离 。 使 用 中 , 切 勿 让 两 种 驱动 方式 (如 果 都 
有 ) 同 时 起 作用 。 链 式 纸 孔 走 纸 驱动 方式 下 ,打印 纸 不 会 走 斜 。 

(2) 色 带 机 构 的 作用 是 提供 打印 的 色 源 , 色 带 通常 被 安装 在 小 圆 盘 形 的 盒 内 ,在 打印 过 
程 中 , 色 带 要 在 传动 机 构 带 动 下 不 停 地 左右 移动 ,以 便 使 打印 针 比 较 均 匀 地 撞击 在 整 条 色 带 
的 各 个 位 置 ,减少 对 一 个 局 部 的 磨损 ,延长 色 带 的 使 用 时 间 。 

(3) 打印 头 是 针 式 打印 机 中 用 于 形成 打印 字符 ,图 形 的 关键 机 构 ,通常 有 纵向 排列 的 9 
个 打印 针 或 24 个 打印 针 两 种 类 型 。 每 个 打印 针 装 置 的 组 成 如 图 10.5(b) 所 示 。 每 根 打印 
针 是 由 刚性 .韧性 都 很 好 的 金属 材料 制 成 ,可 以 沿 着 导轨 前 后 运动 ,运动 的 动力 来 自 电 磁 衔 
铁 的 正 向 (前 进 ) 推 动 和 机 械 弹 簧 的 反 向 (后 退 ) 推 动 , 当 电磁 铁 的 线圈 中 给 出 一 个 脉冲 电流 
(对 应 需要 打印 一 个 点 ) 时 将 产生 磁场 ,电磁 衔 铁 会 在 这 一 磁场 作用 下 向 前 移动 ,推动 打印 针 
也 向 前 移动 并 撞击 色 带 ; 当 线 圈 中 的 电流 消失 后 .磁场 消失 ,电磁 衔 铁 也 失去 作用 力 , 机 械 弹 
得 的 反 向 推力 把 打印 针 推 回 原来 位 置 。 由 于 多 个 打印 针 可 以 同时 被 驱动 , 故 一 次 打印 是 一 
个 字符 的 一 个 纵向 的 点 阵列 ,之 后 使 打印 头 向 右 移 动 一 个 点 的 位 置 ,就 可 以 打印 字符 的 下 一 
个 点 阵列 , 几 次 之 后 就 打印 出 一 个 完整 的 字符 ;再 控制 打印 头 向 右 移动 一 定 间距 ,就 可 以 开 
始 下 一 个 字符 的 打印 过 程 ,直到 打印 完 该 行 上 的 全 部 字符 。 接 下 来 是 走 纸 机 构 控 制 走 纸 , 打 
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(a) (b) 
图 10.5 针 式 打印 机 的 组 成 结构 
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印 头 回 到 打印 机 的 最 左 侧 位 置 , 开 始 下 一 行 字符 的 打印 过 程 。 

(4) 针 式 打印 机 有 自己 的 一 些 打印 控制 逻辑 电路 与 缓冲 存储 器 电路 。 打 印 控制 逻辑 中 比 
较 重 要 的 是 字形 发 生 器 ,包括 西 文 和 中 文字 符 的 点 阵 信息 库 ; 缓 冲 存储 器 用 于 存储 CPU 送 来 
的 被 打印 的 字符 的 编码 ,容量 至 少 能 存放 一 行 字符 的 编码 ,现在 的 打印 机 通常 可 存放 更 多 的 内 
容 ; 这 样 在 CPU 和 打印 机 之 间 传 送 的 信息 量 相 对 较 少 ,由 字符 的 编码 找到 它 的 点 阵 信 息 是 在 
打印 机 控制 逻辑 电路 之 内 完成 的 ,并 用 这 些 点 阵 信息 控制 打印 针 的 运动 。 当 用 针 式 打印 机 打 
印 图 形 、 图 像 时 ,CPU 就 得 直接 提供 图 形 、 图 像 的 点 阵 信息 以 控制 打印 针 的 运动 。 

针 式 打印 机 也 可 以 完成 彩色 打印 , 它 采 用 由 3 条 不 同 颜色 条 组 成 的 彩色 色 带 ,并 可 以 在 
打印 过 程 中 通过 上 下 移动 色 带 ,使 不 同 颜色 的 色 带 条 处 在 打印 头 之 下 ,从 而 打印 出 不 同 颜色 
的 字符 。 彩 色 针 式 打印 机 实用 性 较 差 ,应 用 相对 较 少 。 

2.， 喷 墨 打 印 机 

喷 墨 打印 机 是 通过 把 很 小 的 墨水 滴 喷 射 到 打印 纸 上 形 成 打印 点 来 完成 打印 输出 功能 
的 。 讨 论 喷 墨 打印 机 时 ,问题 主要 集中 在 如 何 提供 出 很 小 的 墨水 滴 , 又 如 何 加 速 墨水 滴 的 喷 
射 速度 ,如 何 准确 控制 墨水 滴 落 到 打印 纸 上 的 位 置 ,如 何 处 理 墨 水 的 循环 流动 和 过 滤 。 解 决 
4 个 问题 有 许多 种 不 同 的 方案 ,从 而 也 就 有 了 以 不 同 原理 工作 的 喷 黑 打印机。 下 面 我 们 将 
介绍 其 中 常用 的 一 种 喷 墨 打印 机 。 图 10.6 示意 性 地 给 出 了 这 种 喷 墨 打印 机 的 组 成 和 打印 
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喷 墨 头 移动 方向 
图 10.6 喷 墨 打印 机 组 成 结构 和 打印 过 程 


在 打印 过 程 中 ,墨水 滴 是 由 喷 墨 头 连续 提供 出 来 的 。 墨 水 在 墨水 泵 的 高 压 作 用 下 进入 
距 墨 头 , 可 以 通过 喷嘴 提供 出 一 东 极 细 的 高 速射 流 , 射 流 的 速度 取决 于 墨水 泵 的 压力 。 在 喷 
墨 头 后 部 有 压 电 陶瓷 , 它 会 在 高 频 振荡 器 的 作用 下 产生 伸缩 ,从 而 可 以 使 这 束 高 速射 流 断 列 
成 均匀 的 墨水 滴 射流 。 

喷 墨 头 喷射 出 来 的 墨水 滴 进 入 充电 电极 区 ,通过 在 充电 电极 板 上 施加 的 静电 场 使 墨水 
滴 充 电 , 要 不 要 充电 . 充 上 多 少 电荷 .由 充电 电极 上 所 加 电压 决定 ,充电 电极 上 所 加 电压 又 受 
字符 发 生 器 的 控制 。 

充电 电极 之 后 是 偏转 电极 板 , 其 上 接 有 恒定 的 高 压 , 用 于 控制 充 上 一 定 电荷 量 的 墨水 滴 
在 垂直 方向 上 的 偏转 距离 .即墨 水 滴 喷射 到 打印 纸 在 垂直 方向 上 的 位 置 。 水 平方 向 的 位 置 
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控制 是 通过 移动 喷 墨 头 完成 的 。 墨 水 滴 在 垂直 方向 上 的 偏转 距离 ,取决 于 墨水 滴 的 充电 量 ， 
充电 量 越 多 ,偏转 的 距离 就 越 大 ,不 充电 则 不 偏转 ,不 偏转 的 墨水 滴 被 回收 槽 挡住 ,不 会 射 到 
打印 纸 上 。 充 电 电极 直接 在 字符 发 生 器 的 控制 下 ,依据 要 打印 的 点 在 纵向 点 阵列 中 的 位 置 ， 
或 该 位 置 上 没有 打印 点 ,确定 向 充电 电极 提供 多 高 的 电压 或 0 电压 ,以 决定 为 墨水 滴 的 充电 
量 , 从 而 控制 该 墨水 滴 射 向 打印 纸 上 确 定 的 位 置 。 

墨水 循环 流动 系统 由 墨水 泵 、 墨 水 容器 .墨水 过 滤器 .墨水 回收 器 和 管道 等 组 成 。 其 中 
的 墨水 泵 ,多 级 的 粗 、 细 过 滤器 ,喷射 嘴 的 正常 工作 是 很 重要 的 。 

喷 墨 打印 机 也 有 单 色 打 印 与 彩色 打印 两 种 类 型 。 彩 色 打印 是 通过 三 基色 原理 , 即 分 别 
喷射 3 种 颜色 , 按 一 定 的 比例 混合 出 所 要 求 的 彩色 出 来 。 这 里 介绍 的 只 是 基本 原理 ,其 实 路 
墨 打印 机 设计 中 涉及 许多 领域 的 知识 ,有 大 量 的 分 析 计 算 工作 ,请 有 兴趣 者 参阅 有 关 资 料 。 
由 于 喷 墨 打印 机 打印 速度 较 快 ,打印 质量 较 高 ,噪声 很 低 ,价格 不 高 等 优点 而 得 到 广泛 应 用 ， 
在 支持 彩色 打印 的 设备 中 占有 重要 地 位 。 

3. 激光 打印 机 

激光 打印 机 是 激光 技术 和 电子 照相 技术 相 结合 的 产物 。 它 由 走 纸 机 构 .激光 扫描 系统 、 
电子 照相 部 分 和 打印 字形 发 生 器 与 控制 器 等 几 部 分 组 成 。 图 10.7 给 出 了 激光 打印 机 组 成 
的 示意 表示 。 
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图 10.7 激光 打印 机 组 成 结构 


激光 扫描 系统 的 功能 是 控制 激光 束 能 扫描 到 字形 鼓 (又 称 光 导 鼓 ,后 面 再 讲 ) 柱 面 的 任 
何 位 置 , 它 由 激光 器 、 偏 转调 制 器 .扫描 器 和 光路 系统 组 成 。 这 些 部 分 未 在 图 10.7 中 加 以 表 
示 。 激 光 器 大 部 分 使 用 氨 一 氛 气 体 激 光 器 . 它 提供 打印 机 运行 所 使 用 的 光源 。 偏 转调 制 器 
通常 用 声 光 器 件 ( 在 器 件 内 ,用 超声 波 改 变 媒体 对 光 的 衍射 特性 来 改变 光线 的 传播 方向 ) 调 
制 激光 永 的 传播 方向 ,扫描 器 实现 激光 永 沿 字形 鼓 的 轴线 重复 做 横向 移动 ,激光 束 的 纵向 移 
动 是 靠 字 形 鼓 的 旋转 完成 的 。 这 样 ,通过 字形 鼓 的 旋转 和 激光 束 的 水 平移 动 , 就 可 以 扫描 到 
字形 鼓 柱 面 的 任何 位 置 。 

电子 照相 部 分 的 核心 部 件 是 字形 鼓 , 这 是 一 个 圆柱 形 ( 鼓 形 ) 的 物体 , 柱 面 高 度 光 洁 , 镀 
有 一 层 由 硒 一 磋 合 金 组 成 (P 型 光 导 材料 ) 的 具有 良好 光 导 特性 (光线 照射 后 电阻 率 降 为 原 
来 的 1/100 到 1/1000) 的 材料 ,用 于 完成 对 打印 内 容 的 照相 显影 和 转 印 。 可 对 电子 照相 的 
全 过 程 简 述 如 下 。 
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(1) 准备 阶段 。 开 始 时 ,通过 电 晤 放电 装置 (用 于 使 附近 的 空气 电离 ) 对 光 导 鼓 表 面 均 
匀 地 充 上 一 层 正 电荷 (离子 化 的 空气 分 子 ) ,其 表面 电位 可 达 几 百 伏 , 光 导 材 料 的 内 层 感 应 出 
负电 荷 的 电子 ,在 没有 光线 照射 的 条 件 下 ,二 者 隔 着 光 导 层 互相 吸引 , 既 不 会 中 和 也 不 会 

(2) 照相 阶段 。 在 由 被 打印 信息 控制 而 提供 出 来 的 激光 束 扫描 光 导 鼓 时 , 光 导 鼓 的 不 
同 部 位 就 会 发 生 不 同 的 变化 ,在 激光 束 照 射 到 的 部 分 ( 称 为 明 区 ) 电 阻 率 降低 ,该 处 的 电荷 将 
会 放 掉 ,激光 永 未 照射 到 的 部 分 ( 称 为 暗 区 ) 的 带电 情况 不 变 , 这 些 剩 下 来 的 静电 区 域 就 是 被 
打印 信息 的 潜 像 。 

(3) 显影 阶段 。 用 的 是 墨 粉 和 表面 涂 有 树脂 薄膜 、 直 径 为 几 百 微米 的 玻璃 珠 为 载体 的 
混合 物 ,运动 中 它们 互相 摩擦 产生 静电 , 墨 粉 被 吸附 在 载体 表面 , 当 这 些 载体 流 过 正经 过 这 
里 的 带 有 静电 潜 像 信息 的 光 导 体 表面 时 ,载体 表面 上 的 墨 粉 被 潜 像 的 静电 电荷 所 吸引 ,离开 
载体 而 黏附 到 了 光 导 体 表 面 , 从 而 形成 了 由 墨 粉 显示 出 来 的 字形 。 

(4) 转 印 阶段 。 完 成 把 光 导 体 表面 的 字形 墨 粉 转移 到 打印 纸 上 , 多 数 采 用 在 打印 纸 的 
背面 (打印 纸 的 正面 贴 靠 到 光 导 体 表面 ) 通 过 电 尝 放出 与 墨 粉 所 带电 荷 极 性 相反 、 电 位 更 高 
的 电荷 ,通过 强力 磁场 把 墨 粉 抢 到 打印 纸 上 来 ,这 就 在 打印 纸 上 有 了 静电 吸附 着 的 墨 粉 
字形 。 

(5) 定 影 阶段 。 是 把 墨 粉 牢靠 永久 固定 在 打印 纸 上 的 工作 。 这 是 通过 红外 光 加 热 或 辆 
射 加 热 的 办 法 ,用 100C 的 温度 把 墨 粉 熔化 并 凝 沾 在 打印 纸 上 , 从 而 完成 完整 的 打印 过 程 。 

激光 打印 机 属于 页 式 打印 机 , 光 导 鼓 每 旋转 一 周 打 印 一 页 内 容 。 在 开始 下 一 页 打印 前 ， 
还 要 由 清扫 器 清除 光 导 鼓 表 面 上 剩余 的 墨 粉 , 消 电 灯 消 除 光 导 鼓 上 残存 的 电荷 。 

激光 打印 机 打印 速度 快 ,打印 质量 高 ,噪声 低 , 有 普及 型 和 各 种 高 档 型 产品 ,被 广泛 应 用 
在 许多 场所 。 


10.3.4 计算 机 终端 


计算 机 终端 是 一 台 把 键盘 输入 和 屏幕 输出 功能 集中 在 一 起 的 .有 自己 控制 器 的 独立 完 
整 的 计算 机 输入 和 输出 设备 ,通过 串 行 接口 与 计算 机 主机 连接 。 在 计算 机 技术 发 展 的 早期 ， 
一 些 公司 制造 计算 机 ,而 另外 一 些 公司 生产 终端 。 为 使 任何 一 台 终 端 可 以 用 在 任何 一 台 计 
算 机 上 ,电子 行业 协会 (Electronics Industries Association,EIA) 制 定 了 RS-232C 计算 机 一 
终端 接口 标准 。 任 何 一 台 支 持 RS-232C 标准 的 终端 都 可 以 连 到 任何 一 台 也 支持 这 个 标准 
的 计算 机 上 。RS-232C 终端 有 标准 的 25 针 连 线 接口 。 它 定义 了 接口 的 机 械 尺 寸 和 形状 、 电 
平 的 高 低 和 针 上 每 个 信号 的 含义 。 

计算 机 终端 是 大 型 机 、 巨 型 机 时 代 的 产物 ,虽然 现在 已 经 进入 个 人 计算 机 普及 的 时 代 ， 
但 在 机 票 预订 ,银行 和 其 他 面向 大 型 机 、 巨 型 机 的 应 用 行业 ,这 些 终端 设备 的 使 用 还 是 十 分 
广泛 ,仍然 发 挥 着 巨大 的 作用 。 


本 章 内 容 小 结 和 学 习 方法 建议 


输入 输出 设备 种 类 繁多 ,功能 多 样 , 组 成 和 运行 原理 各 不 相同 ,本 章 重点 以 点 阵 方式 运 
行 的 设备 的 组 成 及 其 工作 原理 进行 讲解 ,输入 设备 包括 计算 机 键盘 和 鼠标 器 ,输出 设备 包括 
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阴极 射线 管 显示 器 、 液 晶 显 示 器 , 针 式 打印 机 、 喷 墨 式 打印 机 和 激光 印字 机 ,更 多 地 围绕 这 些 
设备 的 电气 功能 实现 来 说 明 ,而 不 是 完整 地 介绍 它们 各 个 方面 的 知识 。 这 里 更 多 地 强调 了 
解 几 种 最 常用 的 输入 输出 设备 的 组 成 概貌 和 使 用 的 问题 ,对 于 本 章 , 同 学 们 可 以 适当 少 花 一 
点 精力 。 


习题 与 思考 题 


1. 点 阵 式 设备 得 以 广泛 应 用 的 原因 是 什么 ? 

2. 显示 器 的 分 辨 率 和 灰 度 级 与 显示 器 的 显示 质量 有 什么 关系 ?分辨 率 和 灰 度 级 的 设 
置 受 哪些 因素 的 限制 ? 

3. CRT 显示 器 中 为 什么 通常 采用 光栅 扫描 方式 ”光栅 扫描 与 随机 扫描 各 自 的 优 缺 点 
是 什么 ? 衡量 显示 器 的 质量 有 哪些 指标 ? 

4. CRT 彩色 显示 器 比 单 色 显 示 器 有 哪些 更 复杂 的 组 成 部 分 ? 

5. 液晶 显示 器 的 优点 是 什么 ? 简 述 其 发 光 原 理 和 显示 信息 的 过 程 。 

6. 针 式 打印 机 由 哪些 部 件 组 成 ? 简 述 打印 头 的 结构 和 打印 出 一 个 字符 的 原理 性 过 程 。 

7. 提高 针 式 打印 机 打印 速度 有 哪些 可 行 办 法 ? 针 式 打印 机 有 什么 优 缺 点 ? 为 什么 很 
少 用 针 式 打印 机 进行 彩色 打印 ? 

8. 喷 墨 式 打印 机 的 印字 过 程 是 更 接近 针 式 打印 机 的 打印 过 程 , 还 是 更 接近 CRT 显示 
器 显示 信息 的 显示 过 程 ? 喷 墨 式 打印 机 有 什么 优 缺 点 ? 

9. 简 述 激光 打印 机 打印 一 页 文字 的 原理 性 工作 过 程 。 

10. 计算 机 的 键盘 是 如 何 得 到 每 个 按键 的 编码 的 ? 

11. 计算 机 的 终端 和 PC 中 的 显示 器 在 组 成 以 及 与 计算 机 主机 的 连接 关系 方面 哪些 
不 同 ? 





输入 输出 系统 


计算 机 输入 输出 系统 通常 由 计算 机 总 线 、 输 入 输出 接口 和 输入 输出 设备 3 个 层次 的 逻 
辑 部 件 和 设备 共同 组 成 。 有 关 输 入 输出 设备 的 内 容 已 经 在 第 10 章 讲解 过 了 ,本 章 将 主要 讲 
解 计算 机 总 线 、 输 入 输出 接口 和 输入 输出 方式 这 3 部 分 知识 。 

总 线 用 于 连接 计算 机 的 各 个 部 件 为 一 体 ,构成 完整 的 整 机 系统 ,在 这 些 部 件 之 间 实 现 信 
息 的 相互 沟通 与 传送 ;输入 输出 接口 用 于 在 计算 机 主机 和 输入 输出 设备 之 间 实 现 正常 连接 
和 信息 的 传送 配合 ;输入 输出 方式 是 指 设备 以 什么 样 的 方式 和 计算 机 主机 进行 数据 交换 。 
本 章 从 实用 的 角度 来 讲解 上 述 有 关内 容 , 包 括 必要 的 一 些 原理 性 知识 和 实例 。 

实例 是 为 了 深入 地 理解 有 关 原 理 知 识 , 并 不 要 求 同 学 们 去 强行 记忆 这 些 实例 本 身 的 具 
体 组 成 细节 ,完成 的 具体 功能 、 技 术 指 标 ` 具 体 使 用 方法 等 详细 内 容 。 把 握 住 所 学 知识 的 主 
线索 ,掌握 好 学 习 原理 性 知识 和 实例 的 具体 内 容 二 者 之 间 一 个 合理 的 精力 分 配 ,是 正确 、 良 
好 的 学 习 方法 的 一 个 方面 。 


11.1 计算 机 输入 输出 系统 概述 


输入 输出 系统 是 完整 计算 机 系统 的 重要 组 成 部 分 ,对 计算 机 系统 的 和 运行 性 能 有 巨大 影 
响 。 它 的 主要 作用 是 连通 计算 机 的 各 个 功能 部 件 和 设备 ,在 它们 之 间 实 现 数据 交换 。 输 入 
输出 系统 的 硬件 部 分 主要 由 计算 机 总 线 和 输入 输出 接口 两 部 分 组 成 ,软件 方面 则 需要 有 操 
作 系 统 软件 的 支持 。 

输入 输出 系统 也 许 是 计算 机 系统 中 最 复杂 多 变 的 部 分 ,原因 是 多 方面 的 。 首 先是 有 太 
多 的 CPU 系列 和 型 号 ,它们 各 自 的 运行 速度 ,处理 功 能 、 接 口 逻辑 都 不 相同 ;又 有 更 多 的 外 
围 设备 ,它们 各 自 的 运行 原理 ,提供 的 功能 、. 读 写 速度 .接口 逻辑 更 是 千差万别 ;要 把 这 么 多 
不 同 的 部 件 (设备 ) 都 能 连接 到 一 起 ,显然 不 是 一 件 简单 的 事情 ,花样 太 多 。 其 次 ,在 计算 机 
系统 中 ,会 有 许多 不 同 的 使 用 要 求 , 不 同 的 人 和 不 同 的 应 用 场合 ,对 算 题 速度 .输入 输出 速 
度 、 单 位 时 间 输 入 输出 的 数据 量 、 对 随时 发 生 事 件 的 响应 与 处 理 的 速度 、 对 系统 总 体 性 能 的 
要 求 上 各 不 相同 ,差异 太 大 。 企图 用 一 种 方式 ,一 套 办 法 全 面 解 决 这 些 问 题 显然 是 不 现实 
的 ,至 少 从 价格 性 能 比 的 角度 来 看 是 不 可 接受 的 。 因 此 ,应 该 在 系统 配置 的 灵活 性 、 良 好 的 
可 扩展 性 、 硬 件 与 软件 的 合理 配合 等 多 方面 来 解决 问题 。 

首先 ,众多 的 部 件 和 设备 要 相互 连接 与 交换 信息 ,建立 尽 可 能 公用 的 交换 信息 的 通路 是 
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必要 的 ,而 且 要 提供 各 部 件 (设备 ) 协 调 使 用 这 些 通路 的 规则 。 这 些 组 成 部 分 ,在 计算 机 内 就 
是 总 线 系统 (Bus System) ,正如 同 在 城市 修筑 的 马路 和 建立 的 交通 信号 灯 系 统一 样 。 总 线 
结构 .总线 宽度 ,总线 时 钟 ` 总 线 仲裁 将 是 在 计算 机 总 线 一 节 中 要 讨论 的 问题 。 

其 次 ,要 把 众多 不 同 的 CPU 与 各 种 不 同 的 输入 输出 设备 连接 起 来 ,要 求 二 者 任何 一 方 
做 出 修改 以 适应 对 方 都 是 不 可 接受 的 。 最 好 的 办 法 是 在 二 者 之 间 放 置 一 个 功能 电路 ,把 二 
者 之 间 的 连接 沟通、 匹配、 缓冲 等 种 种 需求 都 放 到 这 个 电路 板 中 解决 。 由 于 该 电路 要 解决 
的 只 是 一 个 确定 的 CPU 和 一 个 确定 的 设备 的 对 接 , 其 复杂 程度 大 为 简化 。 这 个 电路 板 被 
称 为 设备 接口 。 为 连接 多 种 CPU 和 多 种 设备 ,接口 的 种 类 数目 最 大 的 理论 值 是 二 者 种 类 
数目 的 乘积 。 在 计算 机 接口 一 节 将 介绍 通用 可 编程 接口 的 一 般 组 成 ,并 以 实例 形式 给 出 常 
用 的 串 行 接口 的 组 成 和 使 用 知识 ,再 简要 说 一 下 并 行 接口 的 有 关内 容 。 

最 后 ,如 何 支持 多 个 1/O 设备 并 发 执行 输入 输出 操作 ,如 何 降低 在 输入 输出 操作 过 程 
中 对 CPU 干预 的 需求 。 与 CPU 相 比 ,许多 设备 的 读 写 速度 是 非常 慢 的 ,如 果 要 求 CPU 一 
定 等 待 这 些 设备 读 写 完成 之 后 才 开始 执行 下 一 条 指令 ,CPU 的 大 部 分 时 间 将 花 在 等 待 上 ， 
系统 性 能 会 悲剧 性 的 降低 。 为 此 ,引进 了 程序 中 断 方式 和 内 存储 器 直接 访问 方式 (DMA)， 
甚至 于 另外 配备 一 台 小 型 计算 机 专门 协助 主 CPU 处 理 输 入 输出 操作 ,以 保证 主 CPU 的 更 
强 的 计算 能 力 被 用 到 更 重要 的 处 理 中 。 这 些 是 在 常用 的 输入 输出 方式 一 节 中 要 讲解 的 内 
容 , 这 里 重点 讲解 中 断 和 DMA 的 概念 ,以 及 它们 的 请 求 ,响应 和 处 理 过 程 。 


11.2 计算 机 总 线 


11.2.1 总 线 概述 


总 线 是 计算 机 中 多 个 设备 共用 的 电子 通道 ,一 般 可 根据 它 的 不 同 功能 对 它 进 行 分 类 。 
它 可 用 在 CPU 内 部 ,为 进出 ALU 的 数据 提供 通道 ,例如 内 部 总 线 ; 也 可 以 用 在 CPU 外 部 ， 
将 CPU 和 内 存 或 输入 输出 设备 连接 在 一 起 .例如 系统 总 线 和 输入 输出 总 线 ,每 类 总 线 都 有 
各 自 的 要 求 和 特性 。 我 们 这 里 主要 讨论 系统 总 线 和 输入 输出 总 线 ,也 就 是 所 谓 的 外 部 总 线 。 

外 部 总 线 设计 的 初衷 之 一 是 为 了 使 更 多 的 外 部 设备 能 连接 到 总 线 上 ,和 计算 机 内 部 部 
件 进 行 通 信 ,满足 计算 机 的 输入 输出 要 求 。 因 此 ,总 线 设 计 者 必须 详细 定义 总 线 的 工作 原 
则 ,并 要 求 所 有 连接 上 来 的 设备 都 遵循 ,这 些 原 则 就 是 总 线 协 议 。 另 外 ,还 要 考虑 总 线 的 驱 
动能 力 ,制定 总 线 的 机 械 和 电子 规格 ,使 第 三 方 的 接口 能 够 负载 适宜 ,并 对 其 提供 合适 的 电 
压 和 时 序 信号 等 。 

许多 总 线 已 经 在 现 有 的 计算 机 上 得 到 广泛 的 应 用 。 其 中 比较 出 名 的 有 OmnibusC(PDP- 
8) .Unibus(PDP-11) .Multibus(8086) 、IBM PC 总 线 (PC/XT) ISA 总 线 (PC/AT)、EISA 
总 线 (80386) 、Microchannel(PS/2) .PCI 总 线 (多 种 个 人 计算 机 )、SCSI 总 线 (多 种 个 人 计算 
机 和 工作 站 )、Nubus(Macintosh) .通用 串 行 总 线 USB( 现 代 个 人 计算 机 )、FireWire( 前 台 
款 机 )、VME 总 线 ( 物 理 实验 设备 ) 和 Camac 总 线 (高 能 物理 设备 )。 这 些 总 线 中 ,有 许多 目 
前 仍 在 使 用 中 。 出 现 如 此 多 的 总 线 标准 ,也 是 因为 要 接 人 计算 机 的 设备 实在 是 太 多 ,又 各 具 
特点 。 

总 线 的 作用 是 连接 计算 机 的 不 同 部 件 和 设备 。 这 些 部 件 和 设备 有 的 是 主动 型 的 ,能 自 
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行 对 总 线 的 数据 传输 进行 初始 化 ,也 就 是 发 起 数据 传输 ,我 们 把 它们 称 为 主 设备 ,如 CPU 
等 ;另外 一 些 设备 只 能 被 动 等 待 主 设备 的 启动 命令 ,我 们 称 之 为 从 设备 ,如 主 存储 器 等 。 当 
然 , 主 设备 和 从 设备 也 是 相对 的 , 某 些 设备 就 可 以 在 某 次 数据 传输 中 充当 主 设备 ,在 另外 一 
次 数据 传输 中 充当 从 设备 。 例 如 , 当 CPU 要 求 磁盘 控制 器 读 写 一 块 存储 空间 时 ,CPU 为 主 
设备 而 磁盘 控制 器 为 从 设备 。 可 是 , 当 磁 盘 控制 器 要 求 内 存 接收 它 从 磁盘 驱动 器 上 读 到 的 
字 时 ,磁盘 控制 器 就 成 了 主 设备 。 表 11.1 列 出 了 几 种 典型 的 主 从 设备 组 合 。 任 何 情况 下 ， 
内 存 都 无 法 成 为 主 设备 。 





表 11.1 总 线 主 从 设备 举例 























主 设备 从 设备 举 例 
CPU 内 存 取 指 令 和 数据 
CPU 输入 输出 设备 初始 化 数据 传输 
CPU 协 处 理 器 CPU 提交 指令 给 协 处 理 器 
输入 输出 设备 内 存 DMA( 直 接 存 储 访问 ) 
协 处 理 器 CPU 协 处 理 器 从 CPU 取 操 作 数 


计算 机 设备 输出 的 二 进 制 信号 通常 比较 弱 , 无 法 驱动 总 线 进行 工作 ,尤其 是 总 线 比 较 
长 ,或 者 上 面 的 设备 比较 多 时 。 因 此 ,多 数 总 线 的 主 设备 都 要 通过 一 片 总 线 驱 动 器 芯片 和 总 
线 相连 ,该 芯片 实际 上 起 了 一 个 放大 器 的 作用 。 与 此 类 似 , 多 数 总 线 的 从 设备 要 通过 总 线 接 
收 器 和 总 线 相连 。 而 对 于 那些 既 能 做 主 设备 ,又 能 做 从 设备 的 设备 , 则 通过 总 线 转发 器 芯片 
和 总 线 连 接 。 这 些 总 线 接口 芯片 通常 是 三 态 门 , 在 设备 不 需要 和 总 线 连接 时 可 以 使 设备 浮 
在 总 线 上 (逻辑 上 和 总 线 断 开 ) ,而 在 需要 时 又 能 和 总 线 连接 ,或 采用 与 之 类 似 的 集 电极 开路 
方式 和 总 线 连接 。 当 两 个 或 两 个 以 上 的 设备 同时 访问 一 根 集 电极 开路 线 时 ,该 线 上 的 信和 号 
是 所 有 这 些 设备 的 信号 的 逻辑 或 ,我 们 称 之 为 线 或 。 对 大 多 数 总 线 , 其 部 分 信号 线 是 三 态 信 
号 ,而 另外 的 那些 具备 线 或 特性 的 信和 号 线 . 是 集 电极 开路 信号。 

一 般 来 说 ,根据 总 线 上 传输 的 信号 不 同 , 总 线 可 分 为 数据 总 线 . 地 址 总 线 和 控制 总 线 。 
数据 总 线 在 计算 机 部 件 之 间 传 输 数 据 ( 数 据 指令) 信息 , 它 的 时 钟 频 率 和 宽度 (位 数 ) 的 乘积 
正比 于 它 支 持 的 最 大 的 数据 输入 输出 能 力 ;地 址 总 线 在 计算 机 部 件 之 间 传 输 地 址 (内 存 地 
址 .UVO 设备 地 址 ) 信 息 . 它 的 宽度 (位 数 ) 决 定 了 系统 可 以 寻 址 的 最 大 内 存 空 间 ; 控 制 总 线 给 
出 总 线 周期 类 型 .1/O 操作 完成 的 时 刻 .DMA 周期 .中 断 等 有 关 的 控制 信号 。 

总 线 周 期 通常 指 的 是 通过 总 线 完成 一 次 内 存 读 写 操作 或 完成 一 次 输入 输出 设备 的 读 写 
操作 所 必需 的 时 间 。 依 据 具 体 的 操作 性 质 ,可 以 把 一 个 总 线 周 期 区 分 为 内 存 读 周期 \. 内 存 写 
周期 .I/O 读 周期 1/O 写 周期 4 种 类 型 。 一 个 总 线 周 期 通常 由 两 个 时 间 段 组 成 : 地 址 时 间 
(Address Time.CPU 向 内 存 或 IO 设备 送出 地 址 信息 到 地 址 总 线 ) .数据 时 间 (Data Time。 
CPU 完成 数据 读 写 ) 。 若 被 读 写 的 内 存 和 外 设 的 运行 速度 够 快 . 可 以 保证 在 这 一 个 数据 时 
间 内 完成 读 写 操作 , 则 该 总 线 周期 在 这 一 数据 时 间 之 后 立即 结束 。 若 被 读 写 的 内 存 和 外 设 
的 运行 速度 低 ,不 能 在 这 一 个 数据 时 间 内 完成 读 写 操作 ,就 必须 再 增加 一 到 几 个 数据 时 间 用 
于 继续 完成 读 写 操作 ,之 后 才 结束 该 总 线 周期 。 在 增加 出 的 这 一 到 几 个 数据 时 间 里 , 称 总 线 
处 于 等 待 状态 ,等 待 状态 的 存在 无 疑 将 降低 系统 的 输入 输出 能 力 。 
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如 果 每 次 数据 传输 都 要 用 两 个 时 间 ( 地 址 时 间 、 数 据 时 间 ) 组 成 的 完整 的 总 线 周 期 完成 
读 写 , 则 称 这 种 总 线 周 期 为 正常 总 线 周期 (Normal Bus Cycle) ,每 次 只 能 传输 一 个 数据 。 若 
希望 提高 数据 传输 速度 ,也 可 以 在 给 出 一 次 地 址 信息 (一 个 地 址 时 间 ) 后 ,接着 用 连续 的 多 个 
数据 时 间 依 次 传输 多 个 数据 ,这 种 运行 方式 被 称 为 总 线 的 狸 发 传输 方式 (Burst Mode) ,又 称 
成 组 数据 传输 方式 , 它 需要 CPU .总线 、 被 读 写 对 象 各 部 件 的 支持 。 


11.2.2 总 线 结构 


在 计算 机 总 线 的 发 展 过 程 中 ,出 现 了 多 种 不 同 的 总 线 结构 ,有 简单 的 单 总 线 结构 ,也 有 
复杂 的 多 总 线 结构 ,不 同 的 总 线 结构 具有 不 同 的 特点 ,但 目的 只 有 一 个 ,就 是 要 提高 整个 计 
算 机 系统 的 性 能 。 下 面 我 们 先 对 单 总 线 、 双 总 线 、 三 总 线 等 不 同 结 构 的 总 线 组 成 方案 进行 简 
单 的 介绍 。 

(1) 单 总 线 是 指 计算 机 只 使 用 唯一 的 一 组 总 线 , 计 算 机 系统 中 所 有 的 部 件 . 设 备 都 连接 
到 这 组 总 线 上 。 例 如 ,美国 DEC 公司 的 PDP-11 计算 机 就 采用 这 一 方案 , 称 为 Unibus。 图 
11.1 给 出 了 其 示意 图 。 该 方案 的 优点 是 结构 简单 ,成 本 低 , 易 于 接 入 新 的 设备 ;缺点 是 不 利 
于 提高 总 线 上 的 数据 传输 率 ,因为 所 有 的 部 件 、 设 备 都 连接 到 并 争 用 这 唯一 的 一 组 总 线 , 每 
次 只 能 在 两 个 部 件 之 间 传 输 数据 ,其 他 部 件 是 不 能 同时 使 用 总 线 的 ,这 被 称 为 不 支持 总 线 的 
并 发 传输 操作 ,不 同 的 数据 传输 只 能 串 行 完 成 。 请 注意 ,这 里 说 的 一 组 总 线 ,都 是 由 地 址 总 
线 ,数据 总 线 和 控制 总 线 3 部 分 组 成 的 (在 双 总 线 和 三 总 线 中 亦 是 如 此 )。 

(2) 双 总 线 是 指 在 计算 机 中 配置 两 组 总 线 , 即 在 处 理 机 总 线 上 通过 一 块 扩 展 总 线 的 控 
制 线路 ,提供 出 男 外 一 组 总 线 , 称 为 输入 输出 总 线 。 比 较 常 用 的 有 工业 标准 总 线 (ISA) 和 扩 
展 的 工业 标准 总 线 (EISA) ,主要 用 于 连接 一 般 的 输入 输出 设备 , 它 的 总 线 时 钟 频率 比较 低 
(例如 8. 33MHz) ,数据 线 位 数 比较 少 ( 可 以 为 1.2 或 4 个 字 节 ) ;而 处 理 机 总 线 的 性 能 则 要 
高 得 多 ,例如 PC 系统 中 ,多 为 33MHz 的 时 钟 频率 和 4 一 8 个 字 节 的 数据 线 位 数 ,可 以 实现 
CPU 与 主 存储 器 之 间 的 高 速 数据 传输 。 这 两 组 总 线 可 以 并 发 执行 输入 输出 操作 ,使 总 线 的 
输入 输出 能 力 和 计算 机 系统 的 总 体 性 能 得 到 很 大 的 提高 。 图 11. 2 给 出 了 双 总 线 结构 的 示 
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图 11.1 单 总 线 结构 示意 图 图 11.2 双 总 线 结构 示意 图 
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(3) 三 总 线 是 指 在 计算 机 中 配置 3 组 总 线 。 即 在 处 理 机 总 线 上 通过 一 块 被 称 为 PCI 桥 
的 控制 线路 ,提供 出 一 组 高 性 能 的 局 部 总 线 , 称 为 PCI 总 线 。 而 把 原来 的 ISA 总 线 和 EISA 
总 线 从 处 理 机 总 线 上 断 开 ,并 通过 IO 控制 线路 连接 到 这 里 的 PCI 总 线 上 。 把 一 些 慢 速 的 
输入 输出 设备 接 到 EISA(ISA) 总 线 上 。PCI 总 线 的 时 钟 频率 比较 高 (例如 33MHz) ,数据 线 
位 数 比 较 多 (例如 4 个 字 节 ) ,主要 用 于 连接 各 种 快速 设备 。 而 处 理 机 总 线 的 性 能 可 能 会 更 
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高 ,例如 66MHz 或 更 高 的 时 钟 频率 和 8 个 字 节 的 数据 线 位 数 。 这 3 组 总 线 可 以 并 发 执行 
输入 输出 操作 ,使 总 线 的 输入 输出 能 力 和 计算 机 系统 的 总 体 性 能 再 次 得 到 更 大 的 提高 。 
图 11. 3 给 出 了 三 总 线 结构 的 示意 图 。 
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图 11.3 三 总 线 结构 示意 图 


随 着 计算 机 技术 的 不 断 发 展 , 总 线 的 结构 也 在 不 断 地 变化 。 目 前 的 个 人 计算 机 中 的 总 
线 结构 也 不 仅仅 就 是 三 总 线 结构 这 么 简单 ,但 总 体 上 还 是 属于 多 总 线 结构 。 在 本 节 后 面 我 
们 将 给 出 目前 主流 个 人 计算 机 系统 的 总 线 实例 。 


11.2.3 总 线 宽度 


总 线 宽度 似乎 是 总 线 设计 中 最 简单 的 一 个 参数 。 总 线 中 地 址 信号 的 根 数 越 多 ,CPU 能 
够 直接 寻 址 的 内 存 空间 越 大 。 若 总 线 中 有 根 地 址 线 , 则 CPU 能 用 它 对 2" 个 不 同 的 地 址 
进行 寻 址 。 为 达到 更 大 的 寻 址 空间 ,总 线 中 需要 的 地 址 线 就 越 多 。 对 数据 总 线 来 说 ,情况 也 
相似 ,需要 一 次 传送 的 数据 字 长 越 长 ,数据 总 线 的 宽度 也 越 宽 。 

问题 是 宽 总 线 需 要 比 窄 总 线 更 多 的 导线 ,同时 也 需要 更 大 的 物理 空间 (如 主板 上 的 总 线 
要 占用 更 多 的 面积 ) 和 更 大 的 插头 。 这 些 因素 都 使 总 线 的 价格 更 昂贵 。 这 就 需要 在 寻 址 空 
间 和 系统 成 本 之 间 进 行 权衡 。 带 有 64 根 地 址 线 的 总 线 , 寻 址 2” 内 存 字 节 的 系统 要 比 只 有 
32 根 地 址 线 的 总 线 系统 成 本 高 。 

但 是 ,从 另 一 个 方面 看 ,计算 机 行业 是 一 个 高 速 发 展 的 行业 ,用 户 对 计算 机 提出 的 速度 
更 快 .存储 容量 更 大 的 要 求 迫使 计算 机 设计 者 不 断 对 已 有 的 总 线 进行 位 数 的 扩展 。 例 如 , 早 
期 的 IBM PC, 采 用 8088 作为 CPU 时 .有 20 位 的 地 址 总 线 ,如 图 11.4(a) 所 示 。 这 种 PC 可 
以 寻 址 1MB 内 存 空间 。 

80286 出 现 后 ,Intel 决定 将 寻 址 空间 增加 到 16MB, 这 样 就 需要 在 总 线 中 增加 4 根 地 址 
信号 线 (为 保持 向 后 兼容 ,不 能 影响 以 前 的 20 根 地 址 信号 ) ,如 图 11.4(b) 所 示 。 这 样 ,又 不 
得 不 在 总 线 中 增加 控制 信号 来 处 理 新 增 的 地 址 线 。 到 80386 时 ,又 要 增加 8 根 地 址 信号 ,以 
及 由 此 带 来 的 控制 信号 ,如 图 11. 4(c) 所 示 。 这 就 使 最 终 的 总 线 CEISA 总 线 ) 要 比 假如 从 开 
始 时 就 采用 32 位 地 址 信号 的 总 线 凌乱 得 多 。 

并 不 仅仅 只 有 地 址 信号 线 才 随 着 时 间 的 推移 不 断 增加 ,总 线 中 的 数据 信号 线 也 有 所 增 
加 ,但 原因 不 一 样 。 一 般 来 说 ,有 两 种 办 法 可 以 提高 总 线 中 的 数据 带宽 : 缩短 总 线 周期 ( 单 
位 时 间 内 传送 次 数 增加 ) 和 增加 总 线 中 数据 信号 线 ( 每 次 传送 更 多 的 数据 位 )。 虽 然后 一 种 
方法 有 可 能 提高 总 线 速度 ,但 由 于 总 线 中 不 同 的 信号 线 的 传输 速度 有 细微 的 差别 ,也 就 是 所 
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图 11.4 PC 总 线 随时 间 的 发 展 变化 


谓 总 线 偏离 问题 的 存在 ,使 得 这 种 办 法 比较 困难 。 总 线 速度 越 快 ,偏离 就 越 严重 。 

提高 总 线 速度 带 来 的 另 一 个 问题 是 无 法 保证 向 后 兼容 ,为 慢 速 总 线 设计 的 旧 主 板 上 无 
法 使 用 新 的 总 线 。 淘 汰 旧 的 主板 又 会 使 他 们 的 用 户 和 生产 厂商 不 满意 。 这 样 ,为 提高 总 线 
数据 速度 而 通常 采用 的 办 法 就 是 增加 数据 信号 线 了 ,与 图 11. 4 中 地 址 信号 的 增加 类 似 。 然 
而 ,这 种 方式 最 终 无 法 产生 一 个 清晰 的 设计 方案 ,只 会 越 来 越 复杂 。 例 如 ,IBM PC 系列 就 
在 几乎 同样 的 总 线 上 和 弄 出 了 8 位 .16 位 和 32 位 数据 信号 的 不 同 版 本 的 总 线 。 

为 彻底 摆脱 超 宽 总 线 带 来 的 问题 ,有 时 设计 者 选择 采用 混合 总 线 方案 。 这 种 方案 放弃 
了 原来 数据 信号 和 地 址 信号 分 开 的 思路 ,而 只 是 笼统 地 说 有 32 根 地 址 信号 和 数据 信号 线 。 
在 总 线 操作 开始 时 ,这 些 信 号 用 作 地 址 信号 ,然后 ,它们 又 可 以 用 作 数 据 信号 。 例 如 ,对 内 存 
写 操作 ,这 就 意味 着 地 址 信号 要 先 传 给 内 存 并 锁 存 起 来 ,然后 才能 在 总 线 上 传送 数据 信号 。 
而 用 原来 地 址 信号 和 数据 信号 相 分 离 的 方案 时 ,地 址 和 数据 可 以 同时 传送 。 混 合 总 线 减 少 
了 总 线 宽度 (和 成 本 ) ,但 也 降低 了 系统 的 速度 。 设 计 者 必须 仔细 权衡 这 两 方面 的 得 失 , 再 做 
出 选择 。 


11.2.4 总 线 时 钟 


总 线 可 以 根据 其 时 钟 类 型 分 为 同步 总 线 和 异步 总 线 两 大 类 。 同 步 总 线 中 有 一 条 由 晶振 
驱动 的 产生 固定 频率 的 方 波 的 信号 线 ,总线 的 所 有 操作 都 将 占用 其 中 的 几 个 完整 方 波 ,我 们 
把 一 个 方 波 的 时 间 称 为 总 线 周期 。 异 步 总 线 中 不 存在 一 个 起 控制 作用 的 时 钟 , 它 的 总 线 周 
期 可 以 是 总 线 操作 所 需 的 任意 长 度 . 并 不 要 求 其 上 面 的 所 有 设备 都 保持 一 致 。 下 面 我 们 分 
别 对 它们 进行 讨论 。 

1. 同步 总 线 

我 们 以 CPU 访问 主 存储 器 的 过 程 来 说 明 同 步 总 线 的 工作 原理 。 图 11. 5 是 CPU 访问 
主 存储 器 的 时 序 ,其 中 ,@ 是 用 于 CPU 和 主 存储 器 同步 的 方 波 ,其 周期 为 了。 读 主 存 的 操作 
从 方 波 的 第 一 个 周期 的 上 升 沿 开 始 , 首 先是 往 地 址 总 线 上 送 要 访问 的 存储 单元 的 地 址 。 
经 过 Tap 延 迟 后 ,地 址 总 线 上 地 址 保持 稳定 ;然后 ,CPU 发 出 MREQ 和 RD 信和 号。 前 一 个 信 
号 说 明 CPU 要 访问 的 是 内 存 ( 反 之 则 是 访问 外 设 ) .后 一 个 信号 表示 要 进行 读 操作 (反之 则 
是 写 操作 )。 假 定 Tap 二 T/2, 我 们 可 以 在 Ti 的 下 降 沿 开始 发 出 MREQ 和 RD 信号 。 如 果 主 
存储 器 响应 速度 足够 快 ,能 够 在 下 一 个 总 线 周 期 T, 送 出 数据 , 则 CPU 可 在 T, 的 下 降 沿 发 
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选 通 信号 ,从 数据 总 线 上 得 到 读 出 的 数据 。 但 一 般 情况 下 ,CPU 速度 比 主 存储 器 要 高 很 多 ， 
因此 ,总 线 周期 也 主要 依赖 CPU 的 速度 来 确定 , 主 存储 器 可 能 在 T; 无 法 给 出 数据 。 为 通知 
CPU 不 要 期 待 马上 得 到 数据 , 主 存在 Ts 的 起 始 处 发 出 一 个 WAIT 信 和 号 ,这 将 插入 一 个 等 竺 
状态 (额外 的 一 个 总 线 周期 ) ,直到 主 存 完成 数据 输出 并 将 WAIT 信 号 置 反 。 由 于 内 存 较 慢 ， 
插入 了 一 个 等 待 状态 (T,)。 在 Ts; 的 起 始 位 置 , 主 存 确 知 它 能 在 本 周期 内 给 出 数据 后 ,将 
WAIT 信 号 置 反 。 

在 T; 的 前 半 部 分 , 主 存 将 读 出 的 数据 放 到 数据 信号 线 上 ,然后 ,在 Ts 的 下 降 沿 ,CPU 选 
通 (也 就 是 读 ) 数 据 信 号 线 , 将 读 出 的 数据 锁 存 (也 就 是 存放 ) 到 内 部 的 一 个 寄存 器 中 。 读 完 
数据 后 ,CPU 再 将 MREQ 和 RD 信号 置 反 。 需 要 的 话 ,CPU 可 以 在 下 时 钟 的 下 一 个 上 升 沿 
启动 另外 一 个 访问 主 存 的 周期 。 

需要 指出 的 是 ,图 11. 5 是 一 个 实际 时 序 关系 的 高 度 简化 版 本 。 实 际 上 ,还 需要 有 很 多 
其 他 的 时 间 限 定 条 件 。 





插入 一 个 等 待 状态 的 读 周 其 
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图 11.5 同步 总 线 上 的 读 时 序 


2. 异步 总 线 

同步 总 线 使 用 同一 个 时 钟 信号 ,工作 原理 简单 ,但 也 存在 一 些 问 题 。 首 先是 它 要 求 所 有 
的 任务 必须 在 一 个 或 多 个 总 线 周期 内 完成 。 即 使 CPU 和 内 存 芯片 可 以 在 3. 1 个 总 线 周期 
内 完成 数据 读 写 的 话 , 使 用 同步 总 线 也 必须 将 其 拉 长 到 4 个 总 线 周 期 ,因为 同步 总 线 不 允许 
有 不 完整 的 总 线 周期 。 另 外 ,如 果 一 条 同步 总 线 上 接 有 多 个 不 同 的 设备 ,这 些 设备 的 数据 传 
输 速度 有 快 有 慢 , 那 么 ,总 线 周 期 就 必须 设计 得 能 满足 最 慢 的 设备 ,而 快速 设备 就 不 可 能 满 
效率 地 运行 。 

采用 如 图 11.6 所 示 的 没有 主 时 钟 的 异步 总 线 后 ,就 可 以 解决 上 述 问题 了 。 它 放弃 了 同 
步 总 线 将 一 切 事情 都 绑 定 在 时 钟 信号 上 的 做 法 ,而 是 在 总 线 的 主 设备 给 出 地 址 信和 号、 
MREQ、RD 及 其 他 所 有 需要 的 信号 后 .再 给 出 一 个 我 们 称 为 主 同步 信号 的 MSYN (Master 
SYNchronization) 信 号 。 当 从 设备 得 到 这 个 信和 号 后 ,就 以 它 本 身 最 快 的 速度 响应 和 运行 , 完 
成 任务 后 ,发 出 从 同步 信号 SSYN(Slave SYNchronization)。 
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主 设备 一 得 到 从 同步 信号 SSYN, 就 知道 数据 已 经 准备 好 , 它 就 可 以 对 数据 进行 锁 存 ， 
并 撤销 地 址 信号 ,同时 将 MREQ、RD 和 MSYN 信 号 置 反 。 从 设备 得 到 已 被 置 反 的 MSYN 信 
号 后 ,知道 一 个 访问 周期 已 经 完成 ,就 可 以 将 SSYN 信 和 号 置 反 , 这 样 ,就 回 到 了 起 始 状态 ,所 
有 的 信号 都 处 于 置 反 状 态 ,等 待 主 设备 启动 下 一 个 总 线 访问 周期 。 


ADDRESS 所 读 内 存单 元 的 地 址 














图 11.6 异步 总 线 工 作 时 序 





异步 总 线 的 时 序 图 用 箭头 来 表示 原因 和 结果 ,就 如 图 11.6 一 样 。MSYN 信 号 的 给 出 使 
数据 信和 号 建立 ,并 使 从 设备 发 出 SSYN 信 号。 依次 地 ,SSYN 信 和 号 的 发 出 将 导致 地 址 信号 的 
撤销 和 MREQ .RD 及 MSYN 信 号 的 置 反 。 最 后 ,MSYN 信 号 的 置 反 导致 SSYN 信 号 的 置 反 ， 
结束 整个 读 过 程 。 

我 们 把 一 连 串 以 这 种 方式 工作 的 信号 称 为 握手 工作 方式 。 它 由 以 下 4 个 必需 的 事件 
组 成 。 

(1) 发 出 MSYN 信 和 号; 

(2) 响应 MSYN 信 号 而 发 出 SSYN 信 和 号。 

(3) 响应 SSYN 信 号 而 将 MSYN 信 号 置 反 。 

(4) 响应 MSYN 信 号 置 反 而 将 SSYN 信 号 置 反 。 

很 明显 ,握手 方式 和 时 序 无 关 。 每 个 事件 都 由 前 一 个 事件 引起 ,而 不 是 由 时 钟 脉冲 控 
制 。 如 果 有 一 对 主 从 设备 速度 较 慢 , 它 也 不 会 影响 下 一 对 快速 的 主 从 设备 。 

现在 ,异步 总 线 的 优势 应 该 是 清楚 了 ,但 实际 上 绝 大 多 数 总 线 都 是 同步 总 线 ,主要 原因 
是 同步 的 系统 容易 设计 和 制造 。 主 设备 只 需 负责 发 出 信号 ,而 从 设备 只 需要 响应 信号 。 在 
不 存在 信号 反馈 的 情况 下 ,如 果 选 择 得 当 , 所 有 设备 在 没有 握手 信号 的 情况 下 也 能 正常 工 
作 。 而 且 , 在 同步 总 线 技术 上 已 经 有 了 大 量 的 投资 。 


11.2.5 总 线 仲裁 


总 线 仲 裁 要 解决 的 是 连接 在 总 线 上 的 多 个 主 设备 同时 使 用 总 线 的 竞争 问题 。 如 CPU 
和 输入 输出 系统 同时 访问 主 存储 器 ,多 处 理 器 系统 中 两 个 处 理 器 同时 申请 使 用 总 线 等 。 为 
防止 发 生 冲突 ,就 要 在 总 线 上 引入 仲裁 机 制 。 仲 裁 机 制 可 根据 总 线 仲裁 器 设置 的 不 同位 置 
分 为 集中 式 仲裁 和 分 散 式 仲裁 。 总 线 仲裁 逻辑 集中 在 一 起 的 仲裁 方式 称 为 集中 式 仲裁 ,而 
分 散 式 仲裁 的 总 线 仲裁 器 分 散在 与 总 线 连接 的 各 个 部 件 或 设备 中 。 集 中 式 仲裁 是 现代 计算 
机 系统 常常 采用 的 方式 ,本 节 主 要 介绍 集中 式 仲裁 方式 。 常 见 的 集中 式 仲裁 方式 有 3 种 : 
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链 式 查询 ,计数 器 定时 查询 和 独立 请 求 。 

1. 链 式 查询 方式 

链 式 查询 方式 如 图 11. 7 所 示 。 在 这 种 仲裁 方式 中 ,有 3 根 总 线 控制 线 : 总 线 状态 线 
(BS) .总线 请 求 线 CBR) 和 总 线 同 意 线 (BG) 。 
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图 11.7 链 式 查询 方式 示意 图 


(1) BS。 总 线 忙 / 闲 状态 线 , 当 其 有 效 时 ,表示 总 线 正 被 某 外 设 使 用 。 

(2) BR。 总 线 请 求 线 , 当 其 有 效 时 ,表示 至 少 有 一 个 外 部 设备 要 求 使 用 总 线 。 

(3) BG。 总 线 同意 , 当 其 有 效 时 ,表示 总 线 控制 部 件 响应 总 线 请 求 (BR)。 

在 这 种 方式 中 ,总 线 同意 信号 (BG) 串 行 地 从 一 个 VO 接口 送 到 下 一 个 1/O 接口 ,如 果 
BG 到 达 的 接口 无 总 线 请 求 , 则 继续 往 下 传 ;如 果 BG 到 达 的 接口 有 总 线 请 求 ,BG 信号 便 不 
再 往 下 传 ,这 意味 着 该 IO 接口 获得 了 总 线 控制 权 。BG 信号 就 像 一 条 链 一 样 串 连 所 有 的 
设备 接口 , 故 这 种 总 线 仲裁 方式 称 为 链 式 查询 方式 。 在 查询 链 中 , 离 总 线 仲裁 器 越 近 的 设备 
就 具有 越 高 的 优先 权 。 

链 式 查 询 方式 的 优点 是 只 用 很 少 几 根 线 就 能 按 一 定 的 优先 次 序 实 现 总 线 控制 ,并 且 这 
种 链 式 结构 很 容易 扩充 设备 。 其 缺点 是 对 询问 链 的 电路 故障 很 敏感 ,如 果 第 n 个 设备 接口 
中 有 关 电 路 出 现 故障 ,那么 ,第 nn 个 设备 以 后 的 设备 都 不 能 进行 工作 ;查询 链 的 优先 级 是 固 
定 的 ,如 果 优 先 级 高 的 设备 出 现 频繁 的 请 求 ,优先 级 较 低 的 设备 就 可 能 长 期 不 能 使 用 总 线 。 

2. 计数 器 定时 查询 方式 

计数 器 定时 查询 方式 如 图 11. 8 所 示 。 在 这 种 仲裁 方式 中 ,总 线 上 任 一 设备 要 求 使 用 总 
线 时 ,都 可 以 通过 “总 线 请 求 线 "(BR) 发 出 总 线 请 求 信号 ,总 线 仲裁 器 接 到 请 求 信号 后 ,在 
“总 线 忙 ”BS) 为 0, 即 总 线 空 闲 的 情况 下 ,让 计数 器 开始 计数 ,计数 值 通过 一 组 地 址 线 发 至 
各 设备 ,当地 址 线 上 的 计数 值 与 请 求 总 线 的 某 一 设备 地 址 一 致 时 ,该 设备 把 “总 线 忙 ”(BS) 
置 位 ,获得 了 总 线 控制 权 。 此 时 ,终止 计数 查询 。 
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图 11.8 计数 器 定时 查询 方式 示意 图 


















































这 种 方式 的 特点 : 每 次 计数 可 以 从 0 开始 ,此 时 各 设备 的 优先 次 序 与 链 式 查询 法 相同 ， 
即 优先 次 序 是 固定 的 ;计数 也 可 以 从 终止 点 开始 ,此 时 各 设备 使 用 总 线 的 优先 级 是 相同 的 。 
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计数 器 定时 查询 方式 的 优点 是 : 优先 次 序 可 以 方便 地 改变 ;这 种 查询 方式 对 电路 故障 
不 如 链 式 查询 方式 敏感 。 其 缺点 是 : 要 增加 一 组 设备 地 址 线 , 从 而 增加 了 控制 线 的 数量 ,而 
且 控 制 也 较为 复杂 。 

3. 独立 请 求 方式 

独立 请 求 方式 如 图 11. 9 所 示 。 在 这 种 仲裁 方式 中 ,每 一 个 共享 总 线 的 设备 均 有 一 对 
“总 线 请 求 线 ”(BR) 和 “总 线 同意 线 ”(BG)。 当 设备 要 求 使 用 总 线 时 , 便 发 出 “总 线 请 求 " 信 
号 ,总 线 仲裁 部 件 中 一 般 有 一 个 排队 电路 ,可 以 根据 一 定 的 优先 次 序 决 定 首先 响应 哪个 设备 
的 请 求 。 

独立 请 求 方式 的 优点 是 : 响应 时 间 快 ,对 优先 次 序 的 控制 也 相当 灵活 , 它 可 以 预先 固定 
优先 次 序 , 也 可 以 通过 程序 来 改变 优先 次 序 。 其 缺点 是 : 控制 线 的 数量 多 ,比如 要 控制 个 
设备 ,必须 有 nn 根 BR 线 和 nn 根 BG 线 , 相 比 之 下 , 链 式 查询 方式 只 需 2 根 , 计 数 器 定时 查询 
方式 只 需 约 logzn 根 ; 独 立 请 求 方式 仲裁 器 也 要 复杂 得 多 。 
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图 11.9 独立 请 求 方式 示意 图 


























11.2.6 总 线 举 例 


总 线 是 连接 计算 机 各 功能 部 件 的 信息 通道 。 计 算 机 早期 只 有 一 条 系统 总 线 , 发 展 到 目 
前 的 多 总 线 结 构 , 诞 生 过 许多 著名 的 总 线 。 本 节 我 们 介绍 几 种 PC 中 还 在 使 用 的 总 线 。 

1. ISA 总 线 

前 面 介绍 过 ,早期 的 PC 使 用 的 是 IBM PC 总 线 , 是 IBM 公司 为 其 PC 制定 的 ,后 成 为 
PC 兼容 机 总 线 的 事实 标准 。 它 最 初 为 8 位 数据 线 ( 后 扩充 到 16 位 )、20 位 地 址 线 ( 后 扩充 
到 24 位 ) ,工作 频率 为 8. 33MHz。 

后 来 , 随 着 PC 市 场 的 日 益 扩 大 ,IBM 希望 能 占有 更 大 的 市 场 份额 ,在 其 新 推出 的 PS/2 
系列 上 ,采用 了 一 种 全 新 的 总 线 Microchannel, 并 不 再 公开 新 总 线 的 技术 标准 ,以 此 来 保护 
自己 的 利益 。 

但 是 ,其 他 PC 厂商 却 乘机 开发 出 新 的 总 线 标准 ,定名 为 工业 标准 结构 (Industry 
Standard Architecture,ISA) 总 线 . 工 作 频 率 还 是 8. 33MHz, 使 原 有 的 许多 设备 还 能 继续 得 
到 使 用 。 其 后 ,以 ISA 为 基础 推出 了 EISA 总 线 , 地 址 线 扩展 到 32 位 。 

ISA 和 EISA 工作 频率 低 , 数 据 传输 率 也 不 高 ,对 于 早期 PC 基于 文本 的 应 用 还 足以 应 
付 : 但 随 着 Windows 系统 的 推出 ,图 形 界面 成 为 PC 的 基本 应 用 界面 ,对 总 线 的 传输 率 提出 
了 更 高 的 要 求 ,ISA 和 EISA 总 线 逐 渐 无 法 满足 应 用 的 要 求 。 
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2. PCI 总 线 

1990 年 推出 了 一 种 新 的 总 线 , 其 带宽 比 EISA 总 线 要 高 ,这 就 是 PCI 总线 (外 围 部 件 互 
连 总 线 ,Peripheral Component Interconnect Bus) 。JIntel 还 成 立 了 一 个 行业 联盟 , 即 PCI 特 
别 利益 集团 ,来 管理 PCI 总 线 的 未 来 ,这 也 使 得 PCI 总 线 的 使 用 越 来 越 普遍 。 事 实 上 ,从 
Pentium 开始 ,每 台 基 于 Intel 的 计算 机 ,以 及 其 他 的 一 些 计算 机 ,都 装配 了 PCI 总 线 。 

最 早 的 PCI 总 线 每 个 周期 传输 32 位 ,速度 为 33MHz( 总 线 周期 为 30ns) ,总 的 带宽 为 
133MB/s。1993 年 推出 了 PCI 2.0, 到 1995 年 又 推出 了 PCI2.1。PCI2.2 中 有 些 专 为 便携 
式 计算 机 设计 的 特性 (主要 是 节省 电池 的 能 量 ) 。PCI 总 线 的 最 高 速度 是 66MHz, 并 能 以 64 
位 传输 , 若 磁盘 和 系统 的 其 他 设备 可 以 保证 速度 ,全 屏 、 全 动画 显示 是 完全 可 行 的 。 在 任何 
情况 下 ,PCI 总 线 都 不 会 成 为 瓶颈 。 

尽管 528MB/s 的 速度 看 起 来 已 经 十 分 快 了 ,但 它 还 是 存在 两 个 问题 。 第 一 , 它 不 适合 
做 内 存 总 线 。 第 二 , 它 无 法 兼容 所 有 旧 的 ISA 卡 。Intel 提出 的 解决 方案 是 为 计算 机 设计 3 
条 或 更 多 的 总 线 ,如 图 11. 10 所 示 。 图 中 ,CPU 可 以 通过 特 设 的 内 存 总 线 和 内 存 交换 数据 ， 
而 且 PCI 总 线 上 还 可 以 连接 一 种 ISA 总 线 。 这 个 设计 可 以 满足 上 面 所 有 的 要 求 ,因此 ,所 
有 早期 的 Pentium 计算 机 都 采用 了 这 种 体系 结构 。 
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图 11.10 早期 Pentium 的 总 线 结构 














这 个 体系 结构 的 两 个 关键 部 件 是 两 片 搭桥 芯片 ,PCI 桥 连接 了 CPU ,内存 和 PCI 总 线 ; 
ISA 桥 则 将 PCI 总 线 和 ISA 总 线 连接 在 一 起 ,而 且 还 能 支持 一 到 两 个 IDE 盘 。 采 用 该 体系 
结构 后 ,CPU 和 主 存 之 间 有 了 专用 的 高 速 通道 ,提高 了 CPU 访问 存储 器 的 带宽 。 而 通过 
PCI 桥 ,PCI 总 线 与 CPU 和 主 存 连 接 ,可 以 为 高 速 的 外 部 设备 (如 SCSI 盘 等 ) 提 高 较 高 的 带 
宽 。 另 外 ,ISA 桥 实现 了 PCI 总 线 和 ISA 总 线 的 互 连 , 为 使 用 以 前 的 ISA 设备 提供 了 接口 。 

到 20 世纪 90 年 代 后 期 ,几乎 所 有 的 人 都 认为 .ISA 总 线 时 代 已 经 过 去 ,因此 ,新 的 设计 
中 把 它 排除 在 外 。 然 而 .也 就 是 在 那个 时 候 . 显 示 器 的 分 辩 率 提高 到 了 1600X1200 左右 ,对 
全 屏幕 显示 全 动画 图 形 的 要 求 也 就 更 高 ,尤其 是 在 一 些 高 度 交 互 的 游戏 中 。 因 此 ,Intel 又 
设计 了 另外 一 种 总 线 ,专门 用 来 驱动 图 形 卡 。 这 就 是 AGP 总 线 ( 加 速 图 形 端口 总 线 ) 。 第 一 
个 版 本 的 AGP 总 线 ,也 就 是 AGP 1. 0, 带 宽 为 264MB/s. 被 定义 为 1X 。 虽 然 比 PCI 总 线 
速度 要 慢 一 些 , 但 它 是 供 图 形 卡 专用 的 。 经 过 这 些 年 的 发 展 ,新 的 版 本 不 断 出 现 , 现 在 的 
AGP 3.0 的 速度 已 达到 2. 1GB/s(8X)。 图 11. 11 给 出 了 Pentium 4 系统 的 总 线 结构 示 
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图 11.11 Pentium 4 的 总 线 结构 



































在 这 种 设计 框架 下 ,桥接 芯片 成 为 结构 的 中 心 。 它 连接 了 系统 的 5 个 主要 部 分 : CPU、 
内 存 、 图 形 适配器 .ATAPI 控制 器 及 PCI 总 线 。 在 某 些 情况 下 ,还 可 让 它 支 持 以 太 网 及 其 
他 高 速 的 设备 。 低 速 的 设备 被 连接 到 PCI 总 线 。 

从 内 部 看 ,桥接 芯片 可 以 分 为 两 部 分 : 内 存 桥 和 I/O 桥 。 内 存 桥 连接 CPU 到 内 存 及 图 
形 适配器 的 总 线 ,1/O 桥 连 接 ATAPI 控制 器 .PCI 总 线 及 其 他 (可 选 ) 快 速 IO 设备 ,为 这 些 
设备 之 间 提供 了 快速 的 直接 连通 通道 。 两 桥 之 间 以 非常 高 的 速度 实现 互 连 。 

PCI 总 线 是 同步 总 线 , 它 上 面 的 所 有 事务 发 生 在 一 个 主 设备 ,正式 名 称 为 发 起 者 ,和 一 
个 从 设备 ,正式 名 称 为 接收 者 ,两 个 设备 之 间 。 为 使 PCI 总 线 的 信号 线 数 目 减 下 来 ,地 址 信 
号 和 数据 信和 号 使 用 共用 信号 线 。 通 过 这 种 方式 ,PCI 卡 上 只 需要 64 位 就 可 以 满足 地 址 信和 号 
和 数据 信号 的 需要 ,虽然 PCI 支持 64 位 地 址 和 64 位 数据 。 

地 址 信号 和 数据 信号 混合 后 工作 流程 如 下 。 对 读 操作 ,在 第 一 个 总 线 周 期 , 主 设备 将 地 
址 送 上 总 线 传递 给 从 设备 ;第 二 个 总 线 周 期 , 主 设备 撤销 地 址 信号 并 将 控制 权 交 给 从 设备 ; 
第 三 个 总 线 周期 ,从 设备 将 读 出 的 数据 送 上 总 线 传递 给 主 设备 。 对 写 操 作 , 主 设备 不 需要 交 
出 总 线 的 控制 权 , 因 为 地 址 和 数据 都 是 由 主 设备 发 出 的 。 不 过 ,最 小 的 事务 依然 需要 3 个 总 
线 周 期 。 若 从 设备 没有 在 3 个 周期 内 响应 请 求 . 它 就 要 插入 等 待 状态 。 不 限 大 小 的 块 传输 
和 其 他 的 几 种 总 线 类 型 也 是 可 以 的 。 

PCI 总 线 采 用 集中 仲裁 方式 .总 线 控制 器 一 般 设置 在 PCI 桥 上 。 每 个 PCI 设备 都 有 两 
根 线 连接 到 仲裁 器 。 其 中 ,REQ# 用 于 发 出 总 线 请 求 .而 GNT# 用 来 接收 总 线 授权 。 申 请 
总 线 时 , 先 由 PCI 设备 (包括 CPU) 发 出 REQ# 信 和 号 ,并 等 待 总 线 仲裁 器 对 它 发 出 GNT# 
信号 。 只 有 得 到 授权 后 ,设备 才能 在 下 一 个 周期 内 使 用 总 线 。 

PCI 总 线 的 信号 线 包括 必 备 信号 和 可 选 信和 号 两 大 部 分 。 其 中 , 必 备 信号 可 分 为 以 下 
5 组 。 

(1) 系统 信号 线 。CLK 和 RST# 。 

(2) 地 址 与 数据 线 。 包 括 32 根 地 址 和 数据 的 复 用 线 以 及 其 他 用 来 解释 数据 与 地 址 的 
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(3) 接口 控制 线 。 控 制 工 作 时 序 , 并 在 主 从 设备 间 进 行 协调 。 

(4) 仲裁 线 。 与 PCI 其 他 信号 线 不 同 .这 组 线 不 是 共享 的 ,每 台 接 入 到 PCI 总 线 的 设备 
各 有 一 对 仲裁 线 直接 连接 到 仲裁 器 上 。 

(5) 错误 报告 线 。 报 告 数 据 或 地 址 校 验 错误 。 

可 选 信号 线 中 ,包括 32 根 用 于 将 地 址 和 数据 复 用 线 扩充 到 64 位 的 信号 线 和 其 他 辅助 


3. PCI Express 

PCI 总 线 遇 到 的 另 一 个 问题 是 它 的 接口 卡 太 大 了 ,它们 无 法 应 用 到 膝 上 计算 机 ,更 不 用 
说 是 掌上 计算 机 了 , 它 的 制造 商 喜 欢 的 是 更 小 的 设备 。 而 且 , 有 些 制造 商 还 想 重新 组 装 PC， 
将 CPU 和 内 存 封闭 到 一 个 微型 的 盒子 中 ,而 将 硬盘 放置 到 显示 器 中 去 。 如 果 还 采用 PCI 
总 线 , 这 也 是 不 可 能 实现 的 。 

解决 上 述 问题 的 方案 之 一 就 是 PCI Express。 它 和 PCI 总 线 几乎 没有 关系 ,事实 上 , 它 
也 不 应 该 算是 总 线 ,但 市 场 营销 人 员 不 愿意 轻易 放弃 已 经 很 知名 的 PCI 这 个 名 称 。 已 经 有 
许多 PC 中 配置 了 PCI Express, 下 面 , 我 们 来 讨论 它 的 运行 原理 。 

PCI Express 方案 的 核心 是 彻底 握 弃 了 在 并 行 导线 上 连接 众多 主 设备 和 从 设备 的 传统 
的 总 线 模式 , 代 之 以 基于 高 速 点 到 点 串 行 连接 设备 的 方式 。 它 对 传统 的 ISA/EISA/PCI 总 
线 进行 了 根本 的 改变 ,而 从 局 域 网 ,尤其 是 交换 以 太 网 借鉴 了 许多 重要 的 思想 。 其 最 基本 的 
出 发 点 是 ; 从 最 深层 次 看 ,PC 是 CPU \ 主 存储 器 及 输入 输出 接口 芯片 互相 连接 而 构成 的 ， 
PCI Express 要 做 的 仅仅 是 为 这 些 芯 片 的 串联 提供 一 种 通用 的 交换 机 制 。 图 11. 12 给 出 了 
一 个 典型 的 PCI Express 的 结构 。 
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图 11.12 典型 的 PCI Express 系统 


在 图 11.12 中 ,CPU ,内存 和 高 速 缓 存 依然 通过 传统 的 方式 连接 ,不 同 的 是 用 交换 网 络 
和 桥接 芯片 (也 可 能 交换 网 络 就 是 桥接 芯片 的 一 部 分 ) 连 接 在 一 起 ,而 每 个 输入 输出 接口 芯 
片 有 专门 的 点 到 点 连 线 连接 到 交换 网 络 。 每 个 这 种 连接 由 一 对 单 向 的 通道 组 成 ,一 个 通道 
从 交换 网 络 到 设备 , 另 一 个 从 设备 到 交换 网 络 。 每 个 通道 由 两 根 导线 组 成 ,一 个 传送 信号 ， 
另外 一 根 是 地 ,以 在 高 速 传 输 中 抵抗 干扰 。 这 种 结构 下 ,所 有 设备 被 同等 对 待 ,形成 了 一 个 
更 为 统一 的 模式 ,应 该 会 蔡 代 原 有 的 总 线 模式 。 

PCI Express 体系 结构 和 原 有 的 PCI 总 线 体系 结构 有 3 点 关键 的 区 别 。 我 们 已 经 指出 
了 其 中 的 两 点 : 集中 的 交换 网 络 取代 了 “多 站 ”的 总 线 , 串 行 的 点 到 点 连接 取代 了 并 行 的 总 
线 。 第 三 点 关键 区 别 比 较 隐蔽 。PCI 总 线 传输 从 概念 上 讲 , 是 由 主 设备 发 出 一 个 命令 给 从 
设备 , 读 一 个 字 或 多 个 字 。 而 PCI Express 的 模型 是 一 个 设备 发 送 一 个 数据 包 到 另 一 个 设 
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备 。 包 由 包头 和 有 效 载荷 组 成 ,是 网 络 中 常用 的 概念 。 包 头 包 含有 一 些 控制 信息 ,这 样 ， 
PCI 总 线 上 的 许多 控制 信号 就 可 以 省 略 了 。 有 效 载荷 由 被 传送 的 数据 组 成 。 从 本 质 上 看 ， 
PCI Express 结构 的 PC 就 是 一 个 微型 的 包 交 换 网 络 。 

除 这 3 点 主要 区 别 外 ,它们 之 间 还 有 另外 一 些 不 同 之 处 。Q@ 包 中 还 有 一 些 检 错 纠 错 码 ， 
可 使 PCI Express 的 可 靠 性 比 PCI 总 线 要 好 。 回 接口 卡 和 交换 网 络 的 连 线 距 离 比较 长 ,最 
长 可 达到 50cm, 这 就 允许 系统 分 离 。@@ 由 于 设备 本 身 可 以 是 一 个 新 的 交换 网 络 , 系 统 的 可 
扩展 性 比较 强 。@ 设 备 可 热 插 拔 ,意味 着 它们 可 在 系统 运行 时 接 入 或 断 开 。@ 串 行 的 接头 
比 原来 的 PCI 接头 要 小 得 多 ,设备 和 计算 机 都 可 以 做 得 小 一 些 。 

4. USB 总 线 

PCI 总 线 为 外 部 设备 提供 了 高 速 的 带宽 ,但 对 于 低速 设备 ,如 键盘 、 鼠 标 、 数 码 照 相机 
等 ,使 用 PCI 总 线 的 成 本 显得 太 高 。 另 外 ,PCI 总 线 和 ISA 总 线 都 要 求 新 设备 使 用 接口 卡 
接 入 到 总 线 上 ,这 意味 着 用 户 要 负责 设置 卡 上 的 开关 和 跳 线 来 保证 新 的 接口 卡 不 和 原 有 设 
备 接口 卡 发 生 冲 突 ,增加 了 用 户 使 用 计算 机 的 困难 。 

为 解决 这 个 问题 ,在 20 世纪 90 年 代 中 期 ,7 家 著名 的 计算 机 公司 (Compaq、DEC.、IBM、 
Intel .MicrosoftNEC 和 Northern Telecom) 共 同 提出 了 一 个 将 低速 输入 输出 设备 连接 到 
计算 机 的 方案 。 这 以 后 , 数 百 家 其 他 公司 加 入 了 这 个 阵营 。 这 个 方案 就 是 通用 串 行 总 线 
(Universal Serial Bus,USB) ,目前 已 在 个 人 计算 机 上 得 到 广泛 的 实现 。 

最 早 参 与 设计 并 将 USB 付 诸 实现 的 公司 对 USB 总 线 提出 了 如 下 技术 指标 。 

(1) 用 户 不 必 再 设置 卡 上 、 设 备 上 的 开关 或 跳 线 。 

(2) 用 户 不 必 再 打开 机 箱 来 安装 新 的 输入 输出 设备 。 

(3) 应 该 只 需要 一 根 电缆 线 就 可 以 将 所 有 设备 连接 起 来 。 

(4) 输入 输出 设备 应 可 以 从 电缆 上 得 到 电源 。 

(5) 单 台 计算 机 最 多 可 连接 127 个 设备 。 

(6) 系统 应 能 支持 实时 设备 (如 声卡 、 电 话 )。 

(7) 计算 机 运行 的 时 候 也 可 以 安装 设备 。 

(8) 安装 新 设备 后 不 必 重 新 启动 计算 机 。 

(9) 新 的 总 线 和 连接 它 的 输入 输出 设备 的 生产 成 本 不 应 该 太 高 。 

这 些 指标 显然 是 为 适应 低速 的 设备 ,如 键盘 、 和 鼠标、 照相 机 ,快照 扫描 仪 .数字 电话 等 提 
出 的 。 最 终 设计 的 USB 总 线 的 总 的 带宽 是 1. 5MB/s, 对 于 一 定数 量 的 这 类 设备 是 足够 了 。 
选择 如 此 低 的 带宽 也 是 为 了 降低 成 本 。 

1998 年 ,USB 标准 完成 后 ,USB 标准 的 设计 者 又 开始 了 一 个 更 高 速度 的 USB 版 本 的 
设计 , 即 USB 2.0。 这 个 标准 和 已 有 的 USB 1. 1 版 本 类 似 , 且 完全 兼容 它 , 只 是 在 前 两 个 版 
本 提供 的 两 种 传输 速度 之 外 ,又 增加 了 480Mbys 的 第 三 级 传输 速度 。 

有 了 480Mb/s 的 USB. 显 然 就 和 颇 为 流行 的 ,名 为 FireWire 的 IEEE 1394 串 行 总 线 有 
了 竞争 关系 , 它 的 速度 为 400Mb/s。 尽 管 目 前 每 台 Pentium 的 计算 机 都 装 上 了 USB 2. 0， 
但 IEEE 1394 好 像 也 没有 消失 的 迹象 ,因为 它 后 面 有 消费 电子 行业 的 支持 。 便 携 式 摄像 
机 .DVD 播放 机 等 设备 在 可 预见 的 将 来 还 将 继续 装配 IEEE 1394 接口 ,因为 这 些 设备 的 制 
造 商 不 愿意 为 很 少 的 改进 而 承担 更 换 标准 的 费用 .而 消费 者 也 不 愿意 去 换 标准 。 

USB 由 一 个 插 在 主 总 线 (如 PCD 上 的 根 集线器 组 成 ( 见 图 11. 10)。 这 个 集线器 的 电缆 
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插口 可 以 连接 输入 输出 设备 或 扩展 集线器 ,以 提供 更 多 的 插口 ,这 样 ,通用 串 行 总 线 系统 的 
拓扑 结构 就 成 了 一 棵 以 在 计算 机 内 部 的 根 集线器 为 根 的 树 。 

USB 中 有 4 根 导线 : 其 中 两 根 用 于 数据 传输 ,一 根 用 作 电源 ,还 有 一 根 用 作 地 。 数 据 传 
输 编码 以 电压 的 转换 来 表示 0, 以 恒定 的 电压 来 表示 1, 有 点 像 磁 记 录 方 式 中 的 见 0 就 翻转 
的 不 归 0 制 。 

当 接 入 一 个 新 的 外 部 设备 时 , 根 集线器 检测 到 这 个 事件 ,并 发 出 中 断 信号 给 操作 系统 。 
然后 ,操作 系统 查询 设备 对 其 进行 识别 ,并 得 到 这 个 设备 所 需要 的 通用 串 行 总 线 带宽 。 若 操 
作 系 统 判断 还 有 足够 的 带宽 来 接 人 这 个 设备 , 它 将 赋 给 设备 一 个 唯一 的 地 址 (1 一 127 之 
间 ) ,并 将 这 个 地 址 和 其 他 一 些 信息 记录 到 设备 内 部 的 配置 寄存 器 中 。 通 过 这 种 方式 ,可 以 
实现 设备 的 热 插 拔 ,而 不 需要 重新 启动 计算 机 ,更 不 需要 用 户 进 行 配 置 。 未 初始 化 的 设备 的 
地 址 是 0, 系 统 通过 这 来 判断 是 否 有 新 设备 。 

我 们 用 图 11. 13 所 示 的 例子 来 说 明 USB 总 线 的 协议 。 每 隔 lms, 根 集线器 会 广播 一 个 
新 帧 ,对 所 有 的 设备 进行 时 间 同步 。 帧 和 位 流 有 关 , 由 数据 包 组 成 ,第 一 个 数据 包 总 是 从 根 
集线器 到 设备 。 该 帧 的 后 续 包 可 能 还 是 从 集线器 到 设备 ,也 可 能 是 从 设备 发 回 到 根 集线器 
的 。 图 11.13 中 即 是 一 个 4 帧 组 成 的 序列 。 
























































时 间 (ms) 一 一 一 
人 空 亲 | ? 
第 1 由 | 第 2 帧 ] 第 3 由 
/ 发 出 、\、 / ”从 根 发 出 、、 
\ 六 2 人 2 NY / 0 的 包 、 
[| SoF|[N | [DATA| Ack] SOF [sor| [our] pArA| Ack| 
人 -来自 设备 ”、、、 


图 11.13 USB 总 线 的 数据 帧 


图 中 第 0 帧 和 第 2 帧 中 没有 工作 要 做 ,因此 只 需要 发 送 一 个 帧 起 始 (Start Of Frame， 
SOF) 包 。 这 个 包 总 是 广播 到 所 有 的 设备 。 第 1 帧 是 一 个 询问 ,例如 ,请 求 扫描 仪 返回 它 正 
在 扫描 的 图 形 的 数据 。 第 3 帧 由 发 送 到 某 个 设备 的 数据 组 成 ,比如 发 送 到 打印 机 的 数据 。 

USB 支持 4 种 类 型 的 帧 : 控制 .同步 , 块 传送 和 中 断 。 控 制 帧 用 于 配置 设备 ,对 设备 发 
出 命令 ,并 查询 它们 的 状态 。 同 步 帧 用 于 那些 需要 以 精确 的 时 间 间 隔 发 送 和 接收 数据 的 实 
时 设备 ,比如 麦克 风 扬声器 和 电话 等 。 它 们 之 间 存 在 可 以 准确 预测 的 延迟 ,但 在 出 错时 数 
据 无 法 重 传 。 块 传送 帧 用 于 对 数据 没有 实时 要 求 的 设备 ,如 打印 机 等 的 大 批量 数据 传送 。 
最 后 ,由 于 通用 串 行 总 线 并 不 支持 中 断 , 所 以 还 需要 中 断 帧 。 例 如 ,如 果 在 键盘 上 的 键 按 下 
时 不 由 键盘 产生 中 断 ,也 可 以 让 操作 系统 每 50 毫秒 轮 询 一 次 键盘 ,采集 已 经 键入 的 键 。 

帧 由 一 个 或 多 个 包 组 成 .有 些 可 能 是 两 个 方向 传输 数据 。 一 共有 4 种 类 型 的 包 存 在 : 
令 牌 包 、 数 据 包 , 握 手包 和 特别 包 。 令 牌 包 从 根 传送 到 设备 ,用 于 系统 控制 。 图 11. 13 中 的 
SOF IN 和 OUT 包 都 是 令 牌 包 。SOF 包 是 每 帧 的 第 一 个 包 , 标 志 着 一 帧 的 开始 。 如 果 不 
需要 做 其 他 工作 ,SOF 包 就 是 该 帧 中 唯一 的 包 。IN 令 牌 包 用 于 查询 ,请 求 设备 返回 要 求 的 
数据 。 它 包含 的 域 中 指出 它 需 要 查询 的 是 哪个 位 流 , 这 样 ,设备 就 可 以 知道 需要 它 返回 什么 
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数据 (如 果 设备 有 多 个 数据 流 )。OUT 令 牌 包 表 示 后 面 跟 的 是 给 设备 的 数据 。 还 有 第 4 种 
令 牌 包 SETUP( 图 11. 13 中 没有 标 出 ) ,用 来 配置 设备 ,对 设备 初始 化 。 

数据 包 DATA 用 来 传送 最 多 可 达 64 字 节 的 信息 ,图 11. 13 给 出 了 数据 包 的 格式 , 它 用 
8 位 (SYN) 进 行 同步 .8 位 (PID) 说 明 数 据 类 型 .然后 是 真正 要 传送 的 数据 (PAYLOAD) ,最 
后 是 16 位 的 循环 元 余 码 (CRC) ,用 于 检测 数据 错误 。 另 外 ,还 定义 了 3 种 类 型 的 握手 包 : 
ACK( 前 面 的 数据 包 已 正确 接收 )、NAK( 检 测 到 CRC 错 ) 和 STALL( 设 备 忙 )。 

最 后 ,我 们 再 回 到 图 11. 13 所 示 的 例子 。 即 使 没有 什么 可 干 时 ,每 1 毫秒 都 必须 有 一 帧 
从 根 集线器 发 出 。 第 0 帧 和 第 2 帧 中 只 有 SOF 包 , 表 示 没 有 工作 要 做 。 第 1 帧 是 查询 帧 ， 
所 以 它 以 SOF 包 开 始 ,然后 是 从 计算 机 到 外 部 设备 的 IN 包 , 后 面 是 从 设备 发 送 到 计算 机 的 
DATA 包 , 由 ACK 包 通 知 设备 数据 已 被 正确 接收 。 如 果 出 错 ,将 向 设备 发 回 一 个 NAK 
包 , 然 后 ,该 包 将 以 块 传送 帧 的 方式 重 传 。 但 如 果 是 实时 数据 , 则 不 进行 重 传 。 第 3 帧 在 结 
构 上 和 第 1 帧 类 似 , 只 是 在 这 帧 中 数据 是 从 计算 机 传送 到 设备 。 

USB 3. 0 版 本 提供 了 更 高 的 传输 速度 ,可 以 达到 5Gb/s, 实 现 了 全 双 工 数据 通信 。USB 
3.0 还 能 够 对 设备 提供 更 大 电力 支持 ,增加 了 电源 管理 功能 。 同 时 ,USB 3. 0 支持 向 下 兼容 
USB 2.0 和 USB 1.1 设备 。 





11.3 输入 输出 接口 


11.3.1 输入 输出 接口 的 功能 


提供 主机 识别 (指定 ,找到 ) 要 用 的 I/O 设备 的 支持 ,这 是 通过 为 每 个 设备 规定 几 个 地 
址 码 或 编号 来 实现 的 。 常 用 的 有 两 种 编 址 方式 。 

(1) 对 计算 机 的 主 存储 器 与 IO 设备 按 统一 的 格式 和 方法 来 分 配 与 安排 地 址 编码 。 最 
典型 的 例子 是 在 PDP-11 计算 机 中 的 用 法 , 它 把 计算 机 可 寻 址 的 最 高 位 置 的 几 千 字 节 的 存 
储 空间 分 配给 所 有 的 1/O 设备 ,而 把 其 他 空间 分 配给 主 存储 器 。 这 样 CPU 就 可 以 用 统一 
的 MOV 指令 访问 主 存储 器 和 IVO 设备 ,而 不 使 用 专用 的 输入 输出 指令 访问 IO 设备 。 在 
一 条 MOYV 指令 中 ,访问 的 到 底 是 主 存储 器 还 是 1/O 设备 ,是 由 用 到 的 地 址 范围 决定 的 。 

(2) 设置 并 使 用 专用 的 输入 (IN) 输 出 (OUT) 指 令 访问 IVO 设备 (执行 输入 输出 操作 )。 
由 于 I/O 设备 的 数量 比较 少 ,就 可 以 用 比较 少 的 地 址 为 它们 编 址 ,该 地 址 被 称 为 IO 端口 
地 址 。 这 种 方案 被 大 部 分 计算 机 普遍 采用 。 

建立 主机 和 设备 之 间 的 控制 与 相互 了 解 的 机 制 , 一 方面 ,主机 可 以 向 设备 发 出 操作 命 
今 , 主 机 可 以 了 解 设备 的 运行 状态 ; 另 一 方面 ,设备 也 可 以 向 主机 提出 自己 的 操作 要 求 。 这 
是 通过 在 接口 卡 中 设置 命令 寄存 器 ,状态 寄存 器 和 中 断 逻 辑 线路 来 完成 的 。 

提供 主机 和 设备 交换 信息 过 程 中 的 数据 缓冲 机 构 ,为 此 ,在 接口 卡 中 要 设置 输入 数据 组 
冲 寄存 器 、 输 出 数据 缓冲 寄存 器 等 部 件 。 

提供 主机 和 设备 交换 信息 过 程 中 的 其 他 特别 需求 支持 ,例如 ,当主 机 和 设备 的 信号 幅度 
不 同时 的 信号 电 平 转换 功能 ,数据 传送 中 的 格式 (并 行 、 串 行 ) 转 换 功 能 ,直接 内 存 访问 中 的 
额外 需求 等 。 

一 般 来 说 ,这 里 提 到 的 前 3 个 组 成 部 分 是 大 部 分 接口 卡 上 都 具有 的 ,最 后 一 条 则 按 具 体 
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需要 特殊 安排 。 图 11.14 给 出 的 是 一 个 基本 的 输入 输出 接口 结构 的 示意 图 。 
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图 11.14 输入 输出 接口 结构 示意 图 


11.3.2 通用 可 编程 接口 组 成 


由 于 外 部 设备 功能 各 不 相同 ,对 接口 的 要 求 也 不 一 样 ,但 人 们 总 是 希望 用 同一 块 接口 卡 
提供 更 多 的 功能 ,以 使 它 能 适用 于 更 多 种 类 的 外 部 设备 。 这 需要 通过 在 接口 卡 上 设置 一 些 
参数 ,供用 户 程 序 来 选择 接口 功能 ,这 种 接口 卡 就 是 常 说 的 通用 可 编程 接口 。 所 谓 的 可 编 
程 , 就 是 在 程序 中 可 通过 指令 指定 接口 的 功能 .设置 接口 的 运行 控制 参数 等 。 通 过 通用 可 编 
程 接口 ,计算 机 主机 仅 需 配 置 少量 的 一 些 接口 ,就 可 接 和 人 多 种 外 部 设备 。 

通用 可 编程 接口 中 ,对 外 部 设备 的 识别 主要 是 通过 对 指令 中 给 出 的 输入 输出 端口 地 址 
进行 译 码 产生 片 选 信号 来 完成 的 。 将 译 码 得 到 的 信号 分 别 接 到 相应 接口 卡 的 片 选 管 脚 ,使 
该 接口 在 指令 给 出 正确 的 端口 地 址 时 ,可 正常 运行 。 早 期 的 计算 机 中 ,经常 采 取 主 机 发 出 广 
播 信息 ,各 接口 卡 自行 比较 是 否 和 本 接口 设置 的 地 址 相同 来 进行 判断 。 

接口 卡 上 通常 有 接口 命令 寄存 器 ,存放 CPU 发 来 的 控制 命令 ;同时 ,还 设置 有 状态 寄 
存 器 ,由 外 部 设备 来 设置 运行 状态 .CPU 可 通过 检测 该 寄存 器 来 了 解 设备 状态 。 通 过 命令 
寄存 器 和 状态 寄存 器 ,可 使 CPU 能 自如 地 控制 外 部 设备 。 

接口 卡 上 还 有 一 个 或 几 个 用 于 输入 输出 数据 缓冲 的 寄存 器 ,这 样 ,可 支持 数据 在 总 线 上 
的 成 组 传送 ,提高 总 线 的 利用 率 和 CPU 的 效率 。 

最 后 ,接口 卡 上 一 般 还 有 处 理 中 断 请 求 . 屏 项 和 判断 优先 级 的 多 辑 线路 ,这 是 使 作为 总 
线 从 设备 的 外 部 设备 主动 向 CPU 提出 操作 请 求 的 重要 机 制 。 


11.3.3 给 入 输出 接口 举例 


当前 ,各 种 计算 机 中 使 用 的 外 部 设备 接口 数量 众多 。 前 面 章节 中 已 经 介绍 的 硬盘 接口 ,如 
IDE、EIDE 等 在 PC 中 依然 使 用 ,SCSI 接口 在 PC 服务 器 上 也 已 经 得 到 广泛 使 用 。 而 USB 接口 
也 逐渐 成 为 PC 的 标准 配置 ,连接 键盘 鼠标、 数字 相机 移动 硬盘 等 低速 设备 。 当 然 , 使 用 最 多 
的 通用 接口 还 是 串 行 接口 和 并 行 接口 ,它们 是 几乎 每 一 台 计 算 机 的 标准 接口 。 

1， 串 行 接口 

串 行 接口 只 需要 一 对 信号 线 来 传输 数据 ,主要 用 于 传输 速度 不 高 .传输 距离 较 长 的 场 
合 。 目 前 几乎 所 有 计算 机 都 采用 EIA RS-232C 作为 串 行 接口 标准 , 它 包 括 了 按 位 串 行 传输 
的 电气 和 机 械 方面 的 规定 。 完 整 的 RS-232C 接口 有 25 根 线 , 采 用 一 个 25 芯 插 头 座 ,但 大 
多 数 情 况 下 只 需 使 用 其 中 的 3 一 5 根 即 可 正常 工作 ,其 中 最 主要 的 是 “发 送 数据 ”和 “接收 数 
据 ? 线 ,它们 用 来 在 两 个 系统 之 间 串 行 传送 信息 ,传送 速率 在 50、75 至 19200b/s 之 间 , 有 多 
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种 速率 可 选择 。 

对 串 行 接口 的 使 用 是 通过 对 其 控制 寄存 器 和 状态 寄存 器 进行 的 。 先 由 主机 对 串 行 接口 
的 控制 寄存 器 发 出 指令 ,设置 好 串 行 接口 的 工作 方式 ,如 同步 还 是 异步 ,数据 传送 速率 .奇偶 
校 验 方式 以 及 字符 长 度 等 。 然 后 ,再 发 送 命令 使 之 开始 工作 。 数 据 传送 期 间 , 主机 可 根据 状 
态 寄 存 器 了 解 串口 的 工作 状态 ,并 据 此 确定 下 一 步 操作 。 下 面 我 们 以 Intel 公司 的 8251 芯 
片 为 例 来 说 明 串 行 接口 芯片 的 组 成 和 用 法 。 

Intel 8251 的 结构 图 如 图 11. 15 所 示 ,其 管 脚 图 在 图 纸 的 器 件 图 部 分 给 出 ,为 28 条 管 脚 
双 列 直 搬 封装 。 从 8251 的 结构 图 上 看 到 它 的 5 个 组 成 部 分 , 即 接收 器 ,发送 器 .调制 解 调控 
制 . 读 / 写 控制 以 及 几 个 人 /出 缓冲 器 。 这 最 后 一 部 分 又 可 细 分 为 状态 缓冲 器 ,发送 数 据 / 命 
令 缓 冲 器 和 接收 数据 缓冲 器 3 部 分 。 





























































































D1 28 -DD, DDo 
D2 27FDo 
RxD 一 3 26|—Vce 
GND— 4 25-RxC 
D5 24 -DTR 
D6 23-RTS 
Ds 7 22 DSR 
D8 21-RESET 
TxC—9 20-CLK 
WRT10 19FTxD 发 送 器 P-S 上 = TxD 
CS 18-TXEMPTY 发 送 控制 上 一 TXE 
cB12 17-CTS —=— EDY 
RD—13 16 上 FSYNDETBD 接收 控制 上 三 RKpy 
RDY-4 -rrpy es 
(a) (b) 


图 11.15 Intel 8251 管 脚 分 布 及 内 部 组 成 框图 


从 使 用 角度 看 ,Intel 8251 是 一 个 可 编程 的 多 功能 通信 接口 电路 。 在 使 用 前 必须 用 方 
式 指令 和 命令 指令 对 其 进行 初始 化 操作 。 

1) 方式 指令 

方式 指令 是 指 把 规定 的 8 位 信息 送 到 8251 的 控制 寄存 器 ,以 指定 其 工作 方式 ,例如 是 
同步 还 是 异步 传送 、 所 用 的 波 特 率 、 每 个 字符 的 长 度 、 对 使 用 奇偶 校 验 的 规定 、 对 停止 位 的 规 
定 等 。 信 息 的 组 成 规定 如 图 11.16 所 示 。 
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D6: 外 同步 检测 | | 规定 帧 控制 | | 对 奇偶 校 验 | | 确定 字符 长 度 | | 确定 波 特 率 
1 外 同步 00 无 效 位 的 规定 00 Sbits 00 同 步 方 式 
SYNDET 为 输入 | | 01 1 个 停止 位 | | X0 不 校 验 | |01 6bits 01 异 步 1 倍 
0 内 同步 101.5 停 止 位 | | 01 奇 校 验 10 7bits 10 异 步 16 倍 
SYNDET 为 输出 | | 112 个 停止 位 | | 11 偶 校 验 11 8bits 11 异 步 64 倍 
D;: 同步 字符 

1 单 同步 字符 

0 双 同 步 字 符 




















图 11.16 方式 指令 的 格式 
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2) 命令 指令 
命令 指令 是 把 规定 的 8 位 信息 送 入 8251 接口 的 控制 寄存 器 ,以 使 其 进入 运行 状态 ,能 
执行 发 送 或 接收 数据 的 操作 。 这 8 位 信息 的 组 成 规定 如 图 11. 17 所 示 。 
Di DE Dy DD DD 
[en | rR TrrsT Er [SBBK| RxE | DTR [TxEN 

















图 11.17 命令 指令 的 格式 


(1) Du 位 为 TxEN, 即 允许 发 送 位 , 为 1 允许 发 送 , 为 0 禁止 发 送 。 

(2) Di 位 为 DTR ,数据 终端 准备 好 , 为 1 时 , 将 迫使 DTR 输 出 为 0。 

(3) D; 位 为 RxE, 即 允许 接收 位 , 为 1 允许 接收 , 为 0 禁止 接收 。 

(4) Ds 位 为 SBBK ,发 送 中 止 字符 , 为 1 迫使 TxD 为 低 , 为 0 正常 工作 。 

(5) Ds 位 为 ER ,错误 标志 复位 , 为 1 使 PE、OE.FE 复位。 

(6) D; 位 为 RTS, 请 求 发 送 , 为 1 迫使 RTS 输 出 为 低 。 

(7) Ds 位 为 不 ,内 部 复位 , 为 1 使 8251 返回 到 方式 指令 格式 。 

(8) D; 位 为 EH, 同步 传送 时 , 使 8251 进入 搜索 方式 ,为 1 允许 搜索 同步 字符 。 

3) 状态 寄存 器 

8251 的 状态 寄存 器 用 于 存放 8251 接口 的 工作 状态 。CPU 通过 检查 该 寄存 器 的 内 容 
了 解 串 行 口 工作 状态 ,以 便 正 确 地 执行 字符 入 、 出 操作 ,其 格式 规定 如 图 11. 18 所 示 。 
Dy iD D, Dy 成 六 Do 
DSR [| svnper] FE | OF | PE | TE | RxRDY | TxRDY 











图 11.18 状态 寄存 器 的 格式 


(1) Du 位 TxRDY ,是 发 送 器 准备 好 信和 号 .输出 ,高 有 效 , 值 为 1 时 ,表明 CPU 可 以 向 
8251 发 送 数 据 。 

(2) Ds 位 TxE, 是 发 送 器 为 空 的 信号 ,输出 ,高 有 效 ,表明 实现 从 并 行 到 串 行 转换 的 移 
位 寄存 器 已 经 变 空 ,从 而 整个 的 发 送 器 都 空 了 。TxE 与 TxRDY 信号 的 区 别 在 于 ,TxE 只 
表明 数据 缓冲 器 为 空 , 若 并 行 到 串 行 转换 的 移 位 操作 尚未 完成 , 则 TxE 仍 为 低 。 

(3) Di 位 是 RxRDY, 是 接收 器 准备 好 信号 ,输出 ,高 有 效 , 其 为 1 时 ,表明 8251 已 经 从 
串 行 输入 端 接 收 了 一 个 字符 , 则 CPU 可 以 到 8251 取 走 该 字符 数据 。 

(4) Ds 位 SYNDET, 只 用 于 同步 方式 传送 ,在 教学 机 中 未 使 用 同步 传送 方式 , 故 不 涉 
及 此 位 。 

(5) PE.OE、FE 这 3 位 为 1. 分 别 表 明 接 口中 出 现 奇 偶 错 (Parity Error) 、 溢 出错 
(Overrun Error) 和 帧 错误 (Framing Error) 。 这 些 错误 的 出 现 并 不 禁止 8251 继续 工作 。 这 
些 错误 标志 信号 可 通过 命令 指令 中 的 D, (ER) 位 使 其 复位 。 

2. 并 行 接口 

串 行 接口 按 位 传送 数据 ,传送 速率 较 低 , 且 由 于 主机 是 按 字 或 字 节 处 理 数据 ,使 用 串 行 
接口 时 需要 进行 并 行 到 串 行 的 转换 。 对 速度 较 高 的 设备 ,如 打印 机 等 ,采用 并 行 数据 传送 方 
式 比 较 合适 。 我 们 以 Intel 公司 的 8255 芯片 来 说 明 并 行 接口 的 组 成 和 用 法 。 

图 11. 19 所 示 的 Intel 8255A 是 一 种 典型 的 并 行 输入 输出 芯片 。 它 有 24 根 输 入 输出 信 
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号 线 , 在 IBM PC/AT 中 , 曾 作为 连接 键盘 、 开 关 、 喇 叭 等 的 



































PAs —|1 40 |[ 广 PA4 
接口 。 PA, 下 2 39—PA;s 
尽管 CPU 可 以 通过 往 8255A 芯片 内 的 状态 寄存 器 中 装 。” PA! 了 4 ”光斑 PA 

入 命令 ,使 它 完成 许多 的 功能 ,但 在 这 里 我 们 还 是 把 注意 力 ” 哑 卫 :3 瞩 REEr 
集中 到 其 中 的 一 些 简单 的 操作 模式 上 。 最 简单 的 使 用 8255A 6ND 一 7 装 广 多 
的 途径 是 把 它 作为 3 个 互相 独立 的 端口 A.B 和 C, 每 个 端口 邮 2% 关上 多 
对 应 一 个 8 位 的 锁 存 寄存 器 。 要 设置 某 个 端口 的 信号 ,CPU Pcs_|11 30[ Ps 








仅仅 需要 在 数据 线 上 发 出 并 保持 一 个 8 位 的 数据 ,直到 成 功 pe; 二 3 加 上 
地 改写 了 该 端口 对 应 的 寄存 器 。 为 把 某 个 端口 用 作 输 入 端 Pe? 十 攻 如 上 多 





口 ,CPU 只 需要 读 人 对 应 寄存 器 的 数据 。 i 
8255A 的 另外 一 种 操作 模式 可 以 用 米 和 外 部 设备 进行 ”PB 了 ls 3 上 PB 
1 4 








“握手 ”"。 例 如 ,为 输出 数据 到 某 个 无 法 随时 接收 数据 的 设 ”PB! 20 21 记 Pa 
备 ,8255A 可 以 把 数据 放 到 某 个 输出 端口 ,然后 等 待 设备 发 a 
过 来 的 脉冲 ,表示 设备 已 经 接收 了 当前 数据 ,并 准备 接收 下 图 19 并 行 输入 输出 芯片 
一 个 数据 。 锁 定 这 些 脉冲 信号 并 将 其 送 往 CPU 所 必需 的 逻 Se 
辑 电路 已 经 包括 在 8255A 的 硬件 中 。 

8255A 除了 3 个 端口 的 24 根 信号 线 之 外 , 它 还 有 8 根 直接 和 数据 总 线 相 连 的 信号 线 、 
片 选 信号 线 . 读 信号 线 和 写 信号 线 ,两 根 地 址 信号 线 以 及 用 来 初始 化 芯片 的 信号 线 。 两 根 信 
号 线 用 于 选 定 分 别 对 应 于 端口 A、B.C 和 状态 寄存 器 的 4 个 内 部 寄存 器 之 一 。 状 态 寄存 器 
用 来 指定 哪个 端口 用 于 输入 ,哪个 端口 用 于 输出 ,或 者 是 其 他 功能 。 一 般 情况 下 ,两 根 地 址 
信号 和 地 址 总 线 的 低 两 位 连接 。 


11.4 输入 输出 方式 


在 计算 机 主机 和 I/O 设备 之 间 , 可 以 采用 不 同 的 控制 方式 进行 数据 传送 。 通 常 分 为 程 
序 直 接 控 制 方式 、 程 序 中 断 传送 方式 、 直 接 存 储 器 存 取 方式 .LO 通道 控制 方式 和 外 围 处 理 
机 入 出 方式 。 它 们 在 性 能 、 价 格 、 致 力 解决 问题 的 着 重点 等 各 方面 都 不 一 样 ,下 面 分 别 介绍 。 


11.4.1 程序 直接 控制 方式 


程序 直接 控制 方式 就 是 完全 通过 程序 来 控制 主机 和 外 部 设备 之 间 的 信息 传送 。 一 般 是 
在 程序 中 安排 一 段 由 输入 输出 指令 和 其 他 指令 组 成 的 程序 段 直 接 控制 外 部 设备 的 工作 。 

传送 数据 时 , 先 对 外 部 设备 (接口 ) 进 行 初始 化 ,让 外 部 设备 处 于 就 绪 状 态 , 接 着 CPU 
等 待 外 部 设备 完成 接收 或 发 送 数据 的 准备 工作 。 在 等 待 时间 内 ,CPU 不 停 地 用 一 条 测试 指 
令 检 测 外 部 设备 的 工作 状态 触发 器 ,一 旦 该 触发 器 已 被 设置 成 “完成 "状态, 即 可 开始 数据 传 
送 工作 ,一 次 传送 完成 后 ,循环 进行 下 一 个 数据 的 传送 。 这 种 控制 方式 十 分 简单 ,但 CPU 
和 外 部 设备 只 能 串 行 工作 ,而 CPU 的 速度 一 般 比 外 部 设备 快 很 多 ,但 也 只 能 等 待 外 部 设备 
处 理 完 一 次 数据 传送 后 才能 进行 下 一 次 传送 ,系统 的 工作 效率 不 高 ,现在 仅 用 于 和 高 速 的 外 
部 设备 之 间 的 数据 传送 。 


输入 输出 系统 


11.4.2 程序 中 新 传送 方式 


程序 直接 控制 方式 中 ,高 速 的 CPU 只 能 在 循环 中 等 待 低速 的 外 部 设备 完成 任务 后 , 才 
能 进行 其 他 工作 ,系统 的 效率 低下 。 如 果 能 在 CPU 发 出 命令 后 , 即 可 去 进行 其 他 工作 ,而 
让 外 部 设备 完成 任务 后 ,再 通知 CPU 进行 下 一 个 数据 的 传送 , 则 可 以 更 好 地 利用 CPU , 提 
高 系统 的 性 能 。 这 就 是 程序 中 断 传 送 方式 。 

1. 中 断 的 基本 概念 

能 引起 中 断 的 事件 ,或 能 发 出 中 断 请 求 的 设备 被 称 为 中 断 源 。 按 中 断 源 的 不 同 ,可 以 把 
中 断 分 成 外 中 断 和 内 中 断 。 由 各 种 输入 输出 设备 ,一些 接口 卡 等 引起 的 中 断 被 称 为 外 (部 ) 
中 断 ;而 由 处 理 机 硬件 故障 、 程 序 运 行 出 错 等 引起 的 中 断 被 称 为 内 (部 ) 中 断 ,例如 非法 指令 、 
算术 运算 溢出 、 校 验 错 、 电 源 故 障 等 都 会 产生 内 中 断 。 

上 述 两 类 中 断 又 被 总 称 为 硬件 中 断 , 它 是 针对 所 谓 的 软件 中 断 而 言 的 , 即 由 写 在 程序 中 
的 语句 (例如 用 户 程序 中 的 系统 调用 指令 ,trap 指令 等 ) 引 起 的 一 段 程序 的 执行 过 程 , 它 很 类 
似 于 一 次 中 断 处 理 过 程 , 故 又 称 其 为 软件 中 断 。 这 里 说 的 软件 中 断 是 严格 地 与 程序 运行 过 
程 同步 的 ,而 硬件 中 断 则 是 随机 发 生 的 。 

从 CPU 要 不 要 接收 中 断 请 求 ,从 能 不 能 限制 某 些 中 断 发 生 的 角度 ,又 可 以 把 中 断 分 成 
可 屏蔽 中 断 和 不 可 屏蔽 中 断 。 那 些 可 以 被 CPU 通过 指令 限制 其 发 出 中 断 请 求 ( 称 为 屏蔽 
中 断 ) 的 中 断 届 于 可 屏蔽 中 断 ,例如 对 某 些 外 围 设备 就 可 以 在 一 段 时 间 里 执行 屏蔽 中 断 ,对 
男 外 一 些 中 断 是 不 允许 执行 屏蔽 中 断 的 ,例如 电源 掉 电 中 断 , 称 这 类 中 断 为 不 可 屏蔽 中 断 。 
如 果 由 于 某 种 事件 的 存在 ,在 很 短 的 一 段 时 间 内 ,不 允许 CPU 接收 任何 一 个 中 断 请 求 ( 禁 
止 中 断 ), 靠 屏蔽 全 部 中 断 是 不 可 取 的 ,通常 是 在 CPU 内 部 设置 一 个 “中断 允许 ”触发 器 ,只 
有 该 触发 器 被 置 为 A1” 状 态 , 才 允许 CPU 响应 中 断 请 求 .该 触发 器 被 置 为 ~0” 状 态 , 则 禁止 
CPU 响应 中 断 请 求 。 为 此 ,在 指令 系统 中 ,要 给 出 * 开 中 断 ” 指 令 ( 置 1” 中断 允 许 触 发 器 ) 和 
“关中 断 ” 指 令 ( 清 0” 中断 允许 触发 器 ) 。 

为 了 管理 众多 的 中 断 请 求 .需要 按 每 个 (类 ) 中 断 处 理 的 急迫 程度 ,对 中 断 进行 分 级 管 
理 , 称 其 为 中 断 优先 级 。 在 有 多 个 中 断 请 求 时 ,总 是 首先 响应 与 处 理 优先 级 最 高 的 一 个 中 断 
请 求 。 如 果 CPU 正在 处 理 优先 级 低 的 一 个 中 断 ,又 来 了 优先 级 更 高 的 一 个 中 断 请 求 , 该 如 
何 处 理 呢 ? 通 常 的 处 理 办 法 是 停止 低 优先 级 的 中 断 处 理 过 程 ,以 便 及 时 响应 更 高 优先 级 的 
中 断 请 求 ,在 该 高 优先 级 中 断 处 理 完成 之 后 , 接 下 来 再 继续 处 理 尚未 完成 的 低 优 先 级 的 中 
断 ,在 该 低 优先 级 中 断 处 理 完成 之 后 ,返回 去 接着 执行 主 程序 。 这 种 在 处 理 中 断 的 过 程 中 又 
可 以 响应 更 高 优先 级 中 断 的 办 法 被 称 为 中 断 嵌 套 。 

2. 中 断 的 处 理 过 程 

程序 中 断 传送 方式 中 ,CPU 发 出 启动 外 部 设备 的 命令 后 ,不 再 等 待 外 部 设备 完成 任务 ， 
而 是 直接 继续 执行 程序 。 当 外 部 设备 完成 数据 传送 任务 后 ,向 CPU 发 出 “中 断 请 求 ”信号 。 
CPU 检测 到 这 个 信和 号 后 ,停止 当前 执行 的 程序 , 转 到 相应 中 断 服务 程序 的 入 口 ,执行 中 断 服 
务 程序 ,完成 数据 传送 工作 ,然后 ,再 返回 中 断 前 的 程序 现场 ,继续 执行 原来 的 程序 。 概 括 来 
说 就 是 一 次 完整 的 中 断 过 程 由 中 断 请 求 、 中 断 响应 和 中 断 处 理 3 个 阶段 组 成 。 

1) 中 断 请 求 

中 断 请 求 是 由 中 断 源 发 出 并 送 给 CPU 的 控制 信号 ,由 中 断 源 设备 通过 置 “1? 设 置 在 接 
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口 卡 上 的 中 断 触发 器 完成 。 为 此 ,需要 为 每 一 个 中 断 源 设置 一 个 中 断 触 发 器 。 如 果 CPU 
希望 在 一 段 时 间 内 有 选择 地 取消 某 个 ( 些 ) 中 断 源 请 求 中 断 的 权力 ,只 要 限制 它 ( 们 ) 置 “1” 自 
己 的 中 断 触发 器 的 能 力 即 可 ,这 是 通过 为 中 断 源 设置 一 个 中 断 屏蔽 触发 器 实现 的 。CPU 可 
以 按 需 要 对 它 执行 置 “1” 或 清 *0” 的 操作 ,中 断 屏 项 触发 器 置 "1”, 表 示 要 屏蔽 该 设备 的 中 断 
请 求 , 即 使 引发 中 断 的 事件 已 经 发 生 , 它 也 不 能 完成 置 "1” 自 己 的 中 断 触 发 器 的 操作 , 仅 在 中 
断 屏蔽 触发 器 为 "0" 状 态 时 (未 屏蔽 中 断 ) ,引发 中 断 的 事件 到 来 时 才能 置 "1” 中 断 和 触发 器 。 

2) 中 断 响应 

当 CPU 接 到 中 断 请 求 信号 (可 能 多 个 ) 时 ,如 果 下 面 2 个 条 件 都 具备 , 它 就 会 响应 中 断 
请 求 。 这 2 个 条 件 包括 : 允许 中 断 ( 人 允许 中 断 触 发 器 为 “1" 状 态 );CPU 结束 一 条 指令 的 执 
行 过 程 ,新 请 求 的 中 断 的 优先 级 ( 比 CPU 此 时 刻 正 处 理 的 任务 ) 更 高 。 中 断 响 应 最 核心 的 
功能 是 停 下 处 于 运行 中 的 主 程序 的 正常 执行 过 程 ,准备 进入 中 断 处 理 阶 段 。 这 里 需要 插 人 
一 条 没有 操作 码 ,不 能 供 编程 使 用 的 指令 ( 称 为 中 断 隐 指 令 ) 的 执行 过 程 ,或 理解 为 一 条 机 器 
指令 延长 出 来 的 几 个 执行 步骤 ,用 于 完成 保存 程序 计数 器 PC 的 内 容 ( 主 程序 的 下 一 条 待 执 
行 指令 的 地 址 ) ,或 许 还 包括 程序 状态 字 、 其 他 现场 信息 的 内 容 到 堆栈 的 操作 功能 。 

3) 中 断 处 理 过 程 

一 次 中 断 处 理 过 程 通常 要 经 过 如 下 几 个 步骤 完成 ,如 图 11. 20 所 示 。 
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图 11.20 中 断 处 理 过 程 


(1) 关中 断 , 保 证 在 此 之 后 的 一 小 段 时 间 之 内 CPU 不 能 响应 新 的 中 断 请 求 。 

(2) 保存 断 点 (PC 的 内 容 , 也 许 还 包括 程序 状态 字 的 内 容 ), 这 一 定 是 用 中 断 隐 指令 ( 纯 
硬件 机 制 ) 实 现 的。 还 要 保存 被 停 下 来 的 程序 的 其 他 现场 信息 ,这 可 以 用 软件 实现 , 即 到 中 
断 服务 程序 的 开始 部 分 完成 。 断 点 和 现场 信息 一 般 保 存 到 堆栈 中 去 ,以 便 支 持 中 断 嵌 套 ; 保 
存 断 点 和 现场 信息 一 定 要 完整 完成 ,这 是 中 断 处 理 完 成 后 ,保证 被 停 下 来 的 程序 得 以 继续 正 
常 运 行 所 必须 的 。 

(3) 判别 中 断 源 ,找到 中 断 服务 程序 的 人 口 地 址 。 在 多 个 中 断 源 发 出 中 断 请 求 时 ,首先 
需要 找 出 其 中 中 断 优先 级 最 高 的 那个 中 断 源 。 这 可 以 采用 硬件 ,也 可 以 采用 软件 完成 。 在 
确定 了 中 断 源 之 后 , 接 下 来 需要 找 出 对 应 于 该 中 断 源 的 中 断 服 务 程序 的 入 口 地 址 ,并 将 该 地 
址 传送 到 程序 计数 器 PC 中 。 得 到 中 断 服务 程序 的 入 口 地 址 ,通常 有 两 种 办 法 。 一 种 在 中 
断 总 控 程序 中 用 专用 的 INTA 指令 接收 中 断 设备 编码 ,再 用 该 设备 编码 到 指定 的 内 存 区 中 
找到 中 断 服务 程序 的 入 口 地 址 。 男 外 一 种 是 中 断 向 量 法 ,由 每 个 中 断 源 直接 提供 中 断 向 量 ， 
以 这 一 中 断 向 量 为 地 址 到 中 断 向 量 表 中 取出 中 断 服务 程序 的 入 口 地 址 。 中 断 向 量 表 是 由 每 
个 中 断 源 的 中 断 服务 程序 的 入 口 地 址 组 成 的 一 张 列表 ,通常 被 存放 在 内 存 中 指定 的 一 片区 
域 中 。 当 中 断 服务 程序 的 入口 地 址 送 入 PC 中 之 后 ,下 一 条 将 执行 的 指令 已 经 是 中 断 服务 
程序 的 第 一 条 指令 , 即 已 经 开始 中 断 服务 处 理 过 程 。 


输入 输出 系统 


(4) 接 下 来 应 执行 一 条 开 中 断 指令 ,以 便 尽快 地 进入 可 以 响应 更 高 级 别 中 断 请 求 的 运 
行 状态 ,在 保证 程序 正确 执行 必需 的 逻辑 关系 的 前 提 下 ,把 从 关中 断 到 下 一 次 开 中 断 之 间 的 
时 间 间 隔 设计 得 越 短 越 好 。 

(5) 车 有 更 高 级 别 中 断 请 求 到 来 , 则 可 以 进入 新 的 中 断 的 响应 过 程 ,否则 执行 中 断 服务 
程序 。 

(6) 执行 完 中 断 服务 程序 ,就 要 准备 返回 主 程序 ,为 此 ,执行 关中 断 。 

(7) 接 下 来 恢复 现场 信息 ,恢复 断 点 。 

(8) 执行 开 中 断 。 这 里 的 关中 断 和 开 中 断 是 为 了 保证 能 完整 地 恢复 现场 的 操作 。 

(9) 开 中 断 之 后 , 若 有 更 高 级 别 中 断 请 求 到 来 , 则 可 以 进入 新 的 中 断 的 响应 过 程 ;否则 ， 
返回 断 点 进入 主 程序 的 执行 过 程 。 

程序 中 断 传 送 方式 在 一 定 程度 上 实现 了 CPU 和 外 部 设备 间 的 并 行 工 作 。 另 外 ,由 于 
中 断 可 以 多 层 典 套 , 因 此 ,可 实现 CPU 和 多 台 外 部 设备 并 行进 行 数据 交 换 。 若 有 超过 一 台 
的 外 部 设备 发 出 中 断 请 求 信号 ,CPU 则 根据 各 外 设 的 中 断 优 先 级 ,依次 进行 中 断 响应 。 

这 种 控制 方式 适用 于 一 些 低速 ,数据 传送 量 不 大 的 外 部 设备 ,但 对 那些 工作 频率 较 高 的 
外 设 , 如 磁盘 、 光 盘 等 ,数据 交换 是 批量 进行 的 ,单位 数据 之 间 的 时 间 间 隔 较 短 , 采 用 程序 中 
断 控制 方式 还 是 会 降低 CPU 的 效率 ,或 者 丢失 数据 。 因 此 ,对 这 些 设备 ,通常 采取 下 面 介 
绍 的 直接 存储 器 访问 方式 。 


11.4.3 直接 存储 器 访问 方式 


直接 存储 器 访问 (Direct Memory Access,DMA) 方 式 希 望 在 更 大 的 程度 上 将 CPU 从 
控制 外 部 设备 进行 数据 交换 的 工作 中 解脱 出 来 ,其 基本 思路 是 在 外 部 设备 和 主 存储 器 之 间 
开辟 直接 的 数据 传送 通道 。DMA 方式 在 输入 输出 系统 中 增加 了 一 个 DMA 控制 器 ,需要 与 
外 部 设备 进行 数据 传送 时 ,CPU 向 DMA 控制 器 发 送 传送 数据 的 主 存 起 始 地 址 和 要 传送 数 
据 的 数量 ,然后 ,CPU 开始 执行 自己 的 程序 ,DMA 控制 器 完成 数据 块 的 传送 ,给 出 当前 传送 
数据 的 地 址 ,取得 总 线 的 使 用 权 , 将 数据 发 送 到 总 线 上 ,并 计算 已 经 发 送 的 数据 个 数 ,直到 整 
个 数据 块 传送 完毕 ,再 向 CPU 发 出 中 断 信号 。 

在 DMA 运行 方式 下 .高 速 I/O 设备 与 主 存储 器 每 交换 一 个 数据 (例如 一 个 字 的 内 容 ) 
一 般 要 占用 一 个 总 线 周期 。 要 交换 一 批 数据 , 则 可 以 有 不 同 的 处 理 方式 。 一 是 独占 总 线 方 
式 , 从 传送 第 一 个 字 开 始 直 到 这 批 数据 传输 完成 的 整个 过 程 ,DMA 都 把 住 总 线 不 放 , 使 总 
线 只 为 本 DMA 使用。 其 缺点 是 CPU 和 其 他 DMA 等 总 线 主 设备 都 要 停止 运行 ,会 影响 系 
统 运行 效率 。 二 是 周期 挪用 方式 .DMA 占用 总 线 周 期 传送 一 个 字 的 期 间 , 若 CPU 在 此 期 
间 并 不 使 用 总 线 , 它 就 继续 执行 指令 ,二 者 均 可 运行 , 互 不 干涉 : 若 CPU 也 要 使 用 总 线 , 则 
发 生 了 争 用 总 线 的 矛盾 ,此 时 CPU 要 让 出 一 个 总 线 周期 先 给 DMA 使 用 ,之 后 自己 才能 得 
到 总 线 使 用 权 并 继续 运行 。 

DMA 控制 器 是 在 中 断 接口 的 基础 上 .加 上 DMA 控制 逻辑 构成 。 一 般 由 设备 识别 逻辑 
( 片 选 信和 号) .控制 /状态 逻辑 .数据 缓冲 电路 .中断 处 理 逻 辑 . 主 存 地 址 寄存 器 数据 数量 计数 
器 和 DMA 请 求 线路 等 部 分 组 成 。 基 本 的 DMA 控制 器 如 图 11. 21 所 示 ,其 中 ADR 是 设备 
地 址 寄存 器 ,MAR 是 主 存 地 址 寄存 器 ,DBR 是 数据 缓冲 寄存 器 , WC 是 数据 数量 计数 器 ， 
CSR 是 控制 状态 寄存 器 。 
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图 11.21 DMA 接口 的 内 部 组 成 


主 存 地 址 寄存 器 存放 读 写 主 存 用 到 的 主 存 地 址 ,一 批 数 据 传 送 开 始 前 ,由 CPU 写 入 其 
初 值 ,以 后 每 传送 一 个 字 ,该 地 址 计数 器 增 量 ,使 其 指向 下 一 个 主 存单 元 。 

数据 数量 计数 器 存放 传送 数据 的 数量 ,通常 用 补 码 给 出 ,由 CPU 写 和 其 初 值 ,以 后 每 
传送 一 个 字 ,该 计数 器 加 1, 当 计数 到 0 时 ,表示 这 批 数据 传送 完毕 ,此 时 DMA 应 向 CPU 发 
中 断 请 求 信和 号。 

DMA 的 控制 /状态 逻辑 由 控制 和 状态 等 逻辑 电路 组 成 ,用 于 修改 主 存 地 址 计数 器 和 数 
据 数量 计数 器 ,指定 传送 功能 (输入 还 是 输出 ) ,协调 CPU 和 DMA 信号 的 配合 与 同步 。 

DMA 控制 逻辑 接收 并 记忆 设备 送 来 的 请 求 数据 传送 的 信号 ,使 其 向 CPU( 总 线 仲 裁 罗 
辑 ) 发 出 DMA 请 求 信号 ,CPU 接 到 这 一 请 求 信和 号 并 响应 后 , 送 回响 应 回答 信号 。DMA 的 
控制 /状态 逻辑 接 到 这 一 回答 信号 ,就 取得 了 总 线 的 使 用 权 , 启 动 数据 传送 ,并 为 下 一 次 的 请 
求 做 好 准备 。 

数据 缓冲 寄存 器 用 于 存放 高 速 设备 与 主 存 之 间 交 换 的 数据 ,也 有 的 DMA 卡 上 不 设置 
数据 缓冲 寄存 器 ,而 由 送出 数据 的 一 方 ,在 指定 的 时 刻 直 接 把 数据 放 到 数据 总 线 上 。 

中 断 机 构 与 通用 接口 中 的 中 断 逻 辑 电 路 的 组 成 完全 相同 ,中 断 请 求 发 生 在 数据 数量 计 
数 器 计数 到 0 值 的 时 刻 , 用 于 向 CPU 报告 本 组 数据 传送 完成 ,并 等 待 新 的 传送 命令 。 

一 次 DMA 传送 过 程 由 3 个 阶段 组 成 ,包括 传送 前 的 预 处 理 .数据 传送 和 传送 结束 处 
理 , 如 图 11. 22 所 示 。 
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继续 执行 主 程序 向 CPU 申请 程序 中 断 
图 11. 22 DMA 传送 过 程 
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传送 前 的 预 处 理 是 由 CPU 完成 的 。 例 如 ,CPU 执行 到 读 写 磁盘 的 系统 调用 语句 时 ,就 
要 启动 DMA 传送 过 程 ,向 DMA 控制 器 送 入 设备 识别 信号 ,启动 设备 ,测试 设备 运行 状态 ， 
送 入 内 存 地 址 初 值 ,传送 数据 的 数据 个 数 .DMA 的 功能 控制 信号 等 。 这 之 后 ,CPU 继续 执 
行 原来 的 程序 ,数据 传送 将 在 DMA 控制 器 控制 下 ,在 磁盘 和 主 存储 器 之 间 自 动 完成 。 

数据 传送 是 在 DMA 控制 器 控制 下 自动 完成 的 。 以 读 磁 盘 为 例 , 当 磁盘 准备 好 一 个 数 
据 , 它 就 向 DMA 控制 器 发 出 请 求 信号 ,DMA 控制 器 向 CPU 发 出 请 求 总 线 使 用 权 的 信号 ， 
若 总 线 空闲 ,总 线 控制 器 将 送 响应 回答 信号 给 DMA 控制 器 ,DMA 控制 器 就 取得 了 总 线 使 
用 权 , 并 启动 数据 传送 过 程 ,把 内 存 地 址 计数 器 的 内 容 送 到 地 址 总 线 , 送 一 个 回答 信号 给 设 
备 , 设 备 就 可 以 把 准备 好 的 一 个 数据 送 到 数据 总 线 ,DMA 向 内 存 发 出 命令 ,从 而 完成 一 次 
数据 传送 。 在 这 个 过 程 中 ,DMA 还 要 完成 对 内 存 地 址 计数 器 和 数据 数量 计数 器 的 计数 操 
作 , 并 通过 检查 数据 数量 计数 器 是 否 为 0, 决定 要 启动 下 一 次 传送 ,还 是 结束 本 次 全 部 数据 
的 传送 过 程 。 

传送 结束 处 理 是 由 数据 数量 计数 器 的 值 为 0 引发 出 来 的 。 数 据 数 量 计数 器 的 值 为 0 
时 ,DMA 将 向 CPU 发 出 中 断 请 求 信 号 ,CPU 响应 这 一 请 求 后 , 转 入 中 断 服务 程序 ,检查 是 
结束 数据 传送 (例如 响应 一 个 磁盘 读 的 系统 调用 语句 全 部 完成 ) ,或 向 DMA 发 去 新 的 操作 
命令 ,以 便 继续 执行 该 系统 调用 语句 中 尚未 完成 的 部 分 的 传送 操作 。 


11.4.4 LO 通道 控制 方式 


DMA 方式 中 ,对 外 部 设备 的 管理 和 一 些 操作 的 控制 仍 需 要 CPU 承担 。 对 大 中 型 机 来 
说 ,由 于 系统 配备 的 外 部 设备 种 类 多 、 数 量 也 多 .CPU 对 外 部 设备 管理 的 负担 也 越发 繁重 。 
I/O 通道 方式 就 是 为 解决 这 个 问题 而 设计 的 。 它 增强 了 DMA 控制 器 功能 ,使 它 能 独立 地 
执行 用 通道 命令 编写 的 输入 输出 控制 程序 ,产生 相应 的 控制 信和 号 送 给 由 它 管辖 的 设备 控制 
器, 继而 完成 复杂 的 输入 输出 程序 。 也 就 是 说 ,1/O 通道 已 具备 处 理 器 的 功能 ,只 是 它 的 指 
令 系统 是 专门 为 输入 输出 操作 设计 的 ,并 在 主机 CPU 的 1/O 指令 指挥 下 ,独立 完成 输入 输 
出 功能 。 


11.4.5 外 国 处 理 机 方式 


对 大 型 计算 机 来 说 ,它们 处 理 的 任务 是 复杂 的 海量 数据 ,输入 输出 的 任务 更 加 繁重 ， 
1/O 通道 控制 方式 可 能 也 无 法 承担 。 这 时 ,需要 有 一 台 或 多 台 输 入 输出 处 理 机 ,也 称 外 围 处 
理 机 ,来 承担 输入 输出 任务 、I/O 系统 与 设备 的 诊断 维护 以 及 人 机 交互 处 理 等 功能 。 外 围 处 
理 机 可 能 就 是 一 般 的 小 型 通用 计算 机 或 微机 , 它 不 但 能 完成 WO 通道 所 完成 的 VO 控制 ， 
还 可 以 完成 码 制 转换 .数据 格式 处 理 、 数 据 块 的 检 错 和 纠 错 等 操作 。 外 围 处 理 机 可 以 被 看 作 
主 CPU 的 伙伴 和 助手 ,促成 计算 机 系统 从 完全 的 功能 集中 型 向 功能 分 布 型 发 展 。 


本 章 内 容 小 结 和 学 习 方法 建议 
当前 的 计算 机 系统 中 ,总 线 的 选择 与 使 用 是 影响 系统 运行 性 能 ,特别 是 输入 输出 能 力 的 


重要 因素 ,但 总 线 设计 与 实现 中 会 涉及 许多 线路 与 处 理 逻 辑 的 细节 ,很 复杂 , 远 不 是 我 们 这 
门 课程 所 能 包括 的 。 本 章 简要 地 介绍 了 计算 机 中 的 总 线 功能 、 总 线 结构 、 总 线 时 间 、 总 线 仲 
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裁 等 ,并 给 出 了 PCI 等 几 种 典型 的 计算 机 总 线 实例 ,要 求学 习 过 后 能 初步 具备 对 总 线 的 性 
能 进行 定性 评估 和 定量 计算 的 能 力 。 

本 章 在 综述 通用 可 编程 接口 的 内 部 组 成 和 接口 线路 在 计算 机 系统 中 的 重要 性 之 后 , 介 
绍 了 Intel 公司 的 Intel 8251 串 行 接口 这 个 实例 ,包括 其 内 部 组 成 、 使 用 方法 等 内 容 。 需 要 
能 够 理解 接口 电路 在 连接 CPU 和 外 围 设备 中 的 作用 ,以 及 需要 解决 的 问题 。 

对 常用 的 输入 输出 方式 ,重点 是 程序 直接 控制 方式 ,程序 中 断 方式 和 直接 内 存 访问 方 
式 , 给 出 了 经 常 遇 到 的 一 些 概念 和 术语 。 


习题 与 思考 题 


1. 计算 机 总 线 的 功能 是 什么 ”从 功能 区 分 ,计算 机 中 通常 要 使 用 哪 3 种 类 型 的 总 线 ? 
它们 各 自 对 计算 机 系统 性 能 有 什么 影响 ? 

2. 简单 画 出 单 总 线 、 双 总 线 、 三 总 线 结构 的 总 线 系统 构成 情况 , 写 出 各 自 的 大 体 时 钟 频 
率 和 数据 总 线 的 位 数 。 

3. 总 线 仲裁 的 作用 是 什么 ? 通常 采用 什么 机 制 完成 总 线 仲 裁 ? 为 什么 ? 

4. 输入 输出 接口 的 作用 是 什么 ? 为 什么 不 把 计算 机 主机 和 输入 输出 设备 一 起 设计 ,使 
它们 能 简单 .直接 地 连接 到 一 起 ,而 要 使 用 接口 电路 呢 ? 

5. 通用 可 编程 接口 中 应 由 哪些 部 件 组 成 ? 各 自 的 功能 是 什么 ? 这 里 的 定语 “通用 ”和 
“可 编程 ”各自 的 含义 是 什么 ? 

6， 串 行 接口 Intel 8251 的 通用 性 、 可 编程 性 表示 在 哪里 ? 为 什么 用 两 个 端口 地 址 可 以 
访问 4 个 不 同 的 寄存 器 ? 状态 寄存 器 的 内 容 是 怎样 被 读 写 和 使 用 的 ? 

7. 计算 机 中 有 哪 几 种 常用 的 输入 输出 控制 方式 ?各 自 的 优 缺 点 是 什么 ? 

8. 不 同 的 输入 输出 方式 ,对 CPU 资源 的 占用 情况 有 什么 不 同 ? 对 CPU 的 使 用 效率 和 
计算 机 整体 性 能 有 什么 影响 ? 

9. 中 断 在 计算 机 系统 中 的 作用 有 哪些 ? 

10. 简 述 CPU 可 以 响应 中 断 请 求 的 条 件 和 时 刻 。 

11. 开 中 断 、. 关 中 断 . 中 断 屏蔽 是 指 什么 ?它们 的 作用 是 什么 ? 

12. 简 述 一 次 中 断 处 理 的 完整 过 程 。 

13. 某 计算 机 有 5 级 中 断 L4 一 Lo ,中 断 屏 项 字 为 MMs;M;MiMo,M; 二 1(0 过 i 之 4) 表示 
对 工 : 级 中 断 进 行 屏 项 。 若 中 断 响应 优先 级 从 高 到 低 的 顺序 是 Lo 一 一 Ls 一 Ls 一 L, 且 要 
求 中 断 处理 优 先 级 从 高 到 低 的 顺序 为 Li 一 Lo 一 L: 一 Li 一 Ls:, 则 Li 的 中 断 处 理 程序 中 设置 
的 中 断 屏蔽 字 是 

A. 11110 B. 01101 C. 00011 D. 01010 

14. DMA 传输 方式 的 优点 是 什么 ? DMA 接口 中 通常 应 包括 哪些 逻辑 部 件 ? 各 自 的 
功能 是 什么 ? 

15. 简 述 DMA 处 理 的 完整 过 程 。 

16. DMA 控制 传送 一 批 数 据 , 从 使 用 总 线 的 角度 区 分 .有 了 哪 两 种 主要 运行 方式 ? 各 自 
的 优 缺点 是 什么 ? 

17. 综述 提高 计算 机 系统 的 总 体 的 输入 输出 能 力 有 哪些 可 行 办 法 ? 


输入 输出 系统 


18. 假设 某 系 统 总 线 在 一 个 总 线 周 期 中 并 行 传送 4 字 节 信息 ,一 个 总 线 周 期 占用 2 个 


时 钟 周期 ,总 线 时 钟 频率 为 10 MHz, 则 总 线 带 宽 是 8 

A. 10 MB/s B. 20 MB/s C. 40 MB/s D. 80 MB/s 
19. 在 系统 总 线 的 数据 线 上 ,不 可 能 传输 的 是 6 

和 A. 指令 B. 操作 数 C. 握手 (应 答 ) 信 号 D. 中 断 类 型 号 
20. 下 列 选 项 中 ,能 引起 外 部 中 断 的 事件 是 5 

A. 键盘 输入 B. 除数 为 0 C. 浮 点 运算 下 浇 ” D. 访 存 缺 页 
21. 下 列 选项 中 的 英文 缩写 均 为 总 线 标准 的 是 . 

A. PCI.CRT.USB.EISA B. ISA.CPI.VESA.EISA 

C. ISA.SCSI.RAM.MIPS D. ISA.EISA.PCI.PCIExpress 
22. 单 级 中 断 系 统 中 ,中 断 服务 程序 执行 顺序 是 

工 .保护 现场 [II. 开 中 断 于. 关中 断 N. 保存 断 点 

V. 中 断 事件 处 理 ”WI. 恢复 现场 中. 中 断 返回 

A.I>V>\>I>\ B. I>I~>V—\ 

Cc.M>N=>V>Y>\ D. N=>I>V>V\>\ 


23. 假定 一 台 计 算 机 的 显示 存储 器 用 DRAM 芯片 实现 .车 要 求 显示 分 辨 率 为 1600X 
1200 ,颜色 深度 为 24 位 , 帧 频 为 85Hz, 显 存 总 带宽 的 50%% 用 来 刷新 屏幕 , 则 需要 的 显存 总 
带宽 至 少 约 为 。 

A.245Mb/s B. 979 Mb/s C. 1958 Mb/s D. 7834 Mb/s 

24. 某 计 算 机 处 理 器 主 频 为 50 MHz, 采 用 定时 查询 方式 控制 设备 A 的 1/O, 查 询 程 序 
运行 一 次 所 用 的 时 钟 周期 数 至 少 为 500。 在 设备 A 工作 期 间 , 为 保证 数据 不 丢失 ,每 秒 需 对 
其 查询 至 少 200 次 . 则 CPU 用 于 设备 A 的 IO 的 时 间 占 整个 CPU 时 间 的 百分比 至 少 
是 





A. 0.02% B. 0.05% C. 0.20% D. 0.50% 

25. 某 计 算 机 的 CPU 主 频 为 500 MHz,CPI 为 5( 即 执行 每 条 指令 平均 需 5 个 时 钟 周 
期 )。 假 定 某 外 设 的 数据 传输 率 为 0.5 MB/s, 采 用 中 断 方式 与 主机 进行 数据 传送 ,以 32 位 
为 传输 单位 ,对 应 的 中 断 服务 程序 包含 18 条 指令 ,中 断 服务 的 其 他 开销 相当 于 2 条 指令 的 
执行 时 间 。 请 回答 下 列 问题 ,要 求 给 出 计算 过 程 。 

(1) 在 中 断 方式 下 ,CPU 用 于 该 外 设 IO 的 时 间 占 整个 CPU 时 间 的 百分比 是 多 少 ? 

(2) 当 该 外 设 的 数据 传输 率 达到 5 MB/s 时 , 改 用 DMA 方式 传送 数据 。 假 定 每 次 
DMA 传送 块 大 小 为 5000 B. 且 DMA 预 处 理 和 后 处 理 的 总 开销 为 500 个 时 钟 周期 , 则 CPU 
用 于 该 外 设 1/O 的 时 间 占 整个 CPU 时 间 的 百分比 是 多 少 ? (假设 DMA 与 CPU 之 间 没 用 
访 存 冲 突 ) 
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第 章 
12 流水 线 技术 


为 了 提高 处 理 机 执行 部 件 的 处 理 速度 ,经 常 在 计算 机 体系 结构 的 部 件 设计 中 采用 流水 
线 技术 。 本 章 首 先 介 绍 流水 线 技术 的 基本 概念 、 表 示 方法 、 流 水 线 的 特点 以 及 流水 线 的 分 类 
等 。 在 本 章 的 第 2 部 分 ,分 析 了 流水 线 技术 中 用 到 的 几 个 主要 的 性 能 指标 。 本 章 还 简单 介 
绍 了 DLX 指令 集 和 基本 实现 ,并 以 DLX 指令 集 为 基础 ,重点 讲述 了 DLX 流水 线 的 基本 实 
现 原理 ,对 流水 线 中 的 相关 问题 进行 了 讨论 ,同时 给 出 了 处 理 各 种 相关 的 基本 方法 。 本 章 最 
后 对 指令 级 并 行 技术 进行 了 简单 的 介绍 。 


12.1 流水 线 的 基本 概念 


12.1.1 流水 线 的 概念 


1. 什么 是 流水 线 

流水 线 技 术 并 不 是 CPU 设计 和 实现 领域 所 特有 的 技术 。 在 计算 机 还 没有 出 现 以 前 ， 
工业 生产 过 程 中 就 已 经 广泛 应 用 流水 线 技术 ,到 了 今天 ,几乎 所 有 的 现代 化 工厂 里 的 生产 线 
都 采用 流水 线 技术 。 例 如 在 某 一 种 产品 的 生产 过 程 中 ,需要 几 道 工序 才能 完成 ,每 道 工序 只 
是 完成 生产 过 程 的 一 小 部 分 操作 ,然后 送 往 下 一 道 工序 继续 处 理 。 如 果 仅 就 生产 某 一 件 产 
品 从 开始 到 完成 所 需要 的 时 间 来 看 ,与 不 采用 流水 线 的 生产 过 程 相 比 ,并 没有 节省 时 间 。 但 
是 从 总 体 上 来 看 .产品 的 生产 率 却 是 大 大 的 提高 了 。 图 12. 1 给 出 了 不 采用 流水 线 方式 和 采 
用 流水 线 方式 进行 产品 生产 的 比较 示意 图 。 

从 图 12.1 中 可 以 看 到 ,假设 生产 一 件 产品 需要 4 道 工序 ,同样 是 生产 N 件 产品 ,流水 
线 生产 方式 比 非 流水 线 方式 所 用 的 时 间 要 少 得 多 ,因为 非 流 水 线 方式 每 4 分 钟 才 有 一 件 产 
品 生产 出 来 ,而 流水 线 方式 每 隔 1 分 钟 就 有 一 件 产品 生产 出 来 ,生产 效率 提高 了 几 倍 ,提高 
的 倍数 是 与 生产 工序 的 数目 相关 的 ,在 这 个 例子 中 就 是 4 倍 。 将 上 述 思想 引入 到 计算 机 技 
术 中 来 就 是 处 理 机 设计 与 实现 的 流水 线 技术 。 

计算 机 中 的 流水 线 是 把 一 个 重复 的 过 程 分 解 为 若干 个 子 过 程 , 每 个 子 过 程 与 其 他 子 过 
程 并 行进 行 。 由 于 这 种 工作 方式 与 工厂 中 的 生产 流水 线 十 分 相似 ,因此 称 为 流水 线 技 术 , 这 
是 一 种 非常 经 济 、 对 提高 计算 机 的 运算 速度 非常 有 效 的 技术 ,只 需 增加 少量 硬件 就 能 把 计算 
机 的 运算 性 能 提高 几 倍 , 高 的 性 能 是 通过 所 谓 的 时 间 并 行 性 得 到 的 , 即 不 同 指令 的 不 同 执行 
步骤 是 在 同一 个 时 间 段 完成 的 .下面 会 更 详细 地 进行 分 析 。 
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和 9 3 dS 6 
1 | 产品 ! 产品 2 产品 3 | 产品 4 
2 产品 1 产品 2 产品 3 产品 4 
3 产品 1 产品 2 产品 3 产品 4 
| 产品 1 产品 2 产品 3 产品 4 
(a) 非 流水 线 生 产 方式 
下 和 
1 | 产品 十 产品 ?| 产品 3| 产 品 4 
2 产品 1 产品 2| 产 品 3| 产 品 4 
3 产品 | 产品 ?| 产品 3| 产 品 4 
| 产品 | 产品 ?| 产品 3| 产 品 4 
(b) 流水 线 生 产 方式 
图 12.1 非 流 水 线 生产 方式 和 流水 线 生产 方式 比较 示意 图 
2. 指令 的 重叠 执行 


一 条 指令 的 执行 过 程 可 以 分 为 多 个 阶段 (或 子 过 程 ), 具 体 分 法 随 计算 机 不 同 而 不 同 。 
图 12.2 中 把 一 条 指令 的 执行 过 程 分 成 以 下 3 个 阶段 。 天 上 分析 | 机 

(1) 取 指 令 。 按 照 指令 计数 器 的 内 容 访问 主 存储 器 ， 8 

取出 一 条 指令 送 到 指令 寄存 器 。 图 12.2 一 条 指令 的 执行 过 程 

(2) 指令 分 析 。 对 指令 操作 码 进行 译 码 ,按照 给 定 的 寻 址 方式 和 地 址 字段 中 的 内 容 形 
成 操作 数 的 地 址 ,并 用 这 个 地 址 读 取 操 作 数 。 

(3) 指令 执行 。 根 据 操 作 码 的 要 求 , 完 成 指令 规定 的 功能 , 即 把 运算 结果 写 到 通用 寄存 
器 或 主 存 中 。 

当 多 条 指令 在 处 理 机 中 执行 时 ,可 以 采用 以 下 几 种 方式 。 

1) 顺序 执行 方式 

指令 的 执行 过 程 如 图 12. 3(a) 所 示 。 顺 序 执行 方式 执行 好 条 指令 所 用 的 时 间 为 





亚 三 Dmm 十 1 析 ; 十 Z 执 行 :》 (GD 


如 果 取 指令 ,分 析 指 令 、 执行 指令 的 时 间 都 相等 每 段 的 时 间 都 为 1, 则 条 指令 所 用 的 
时 间 为 
T= 3m X12 2 
传统 的 汉 “。 诺 依 曼 机 器 采用 顺序 执行 方式 ,又 称 为 串 行 执行 方式 ,优点 是 控制 简单 , 节 
省 设备 。 主 要 的 缺点 有 : 一 是 处 理 机 执行 指令 的 速度 很 慢 , 只 有 当 上 一 条 指令 全 部 执行 完 
毕 后 下 一 条 指令 才能 够 开始 执行 。 二 是 功能 部 件 的 利用 率 很 低 , 如 取 指 令 时 主 存 是 忙碌 的 ， 
而 指令 执行 部 件 是 空闲 的 。 而 执行 指令 时 指令 执行 部 件 是 忙碌 的 ,而 主 存 经 常 是 空闲 的 。 
2) 一 次 重 有 执行 方式 
这 种 方式 把 执行 第 条 指令 与 取 第 k 十 1 条 指令 同时 进行 ,如 图 12. 3(b) 所 示 。 如 果 执 
一 条 指令 的 3 个 阶段 时 间 均 相等 , 则 执行 n 条 指令 所 用 的 时 间 为 
= (1 2 C12, 3) 
采用 一 次 重 伙 执行 方式 后 带 来 了 两 个 优点 : 一 是 程序 的 执行 时 间 缩 短 了 近 一 半 ; 二 是 
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功能 部 件 的 利用 率 明显 提高 。 主 存 基本 上 可 以 处 于 忙碌 状态 ,其 他 功能 部 件 的 利用 率 也 得 
到 提高 。 为 此 需要 付出 一 定 的 代价 , 即 需 要 增加 一 些 硬件 ,控制 过 程 也 变 得 复杂 一 些 。 

3) 二 次 重生 执行 方式 

为 了 进一步 提高 指令 的 执行 速度 ,可 以 把 取 k 十 1 条 指令 提前 到 分 析 第 条 指令 同时 进 
行 , 而 将 分 析 第 k 十 1 条 指令 与 执行 第 & 条 指令 同时 进行 ,如 图 12. 3(c) 所 示 。 如 果 执 行 一 
条 指令 的 3 个 阶段 时 间 均 相等 , 则 执行 n 条 指令 的 所 用 时 间 为 

T= (n+2)t (12.4) 

与 顺序 执行 方式 相 比 ,采用 二 次 重 站 执行 方式 能 够 使 指令 的 执行 时 间 缩 短 近 2/3。 这 

是 一 种 理想 的 指令 执行 方式 ,在 正常 情况 下 ,处理 机 中 同时 有 3 条 指令 在 执行 。 








取 指 4 | 分 析 k | 执行 4 | 取 指 k+1 | 分 析 k+1 | 执行 +1 
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(a) 顺序 执行 方式 








取 指 +2 | 分 析 k+2 | 执行 t+2 
取 指 k+1 | 分 析 k+1 | 执行 k+1 
取 指 k | 分 析 k | 执行 上 




















(b) 一 次 重合 执行 方式 





取 指 k+2 | 分 析 k+2 | 执行 tt2 
取 指 {+1 | 分 析 k+1 | 执行 t+1 
取 指 k | 分 析 k | 执行 k 





























一 
(c) 两 次 重生 执行 方式 
图 12.3 指令 的 几 种 执行 方式 


上 面 介绍 的 指令 重 且 执行 方式 实际 上 就 是 指令 流水 线 ,指令 流水 线 是 多 条 指令 并 行 执 
行 的 一 种 实现 技术 。 


12.1.2 流水 线 的 表示 方法 


在 计算 机 的 流水 线 中 ,流水 线 的 每 一 个 阶段 完成 一 条 指令 的 一 部 分 ,不 同 阶段 并 行 完 成 
流水 线 中 不 同 指令 的 不 同 部 分 。 流 水 线 中 的 每 一 个 阶段 称 为 一 个 流水 阶段 .流水 节拍 、 流 水 
步 、 流 水 段 等 。 一 个 流水 阶段 与 男 一 个 流水 阶段 相连 接 形成 流水 线 。 指 令 从 流水 线 的 一 端 
进入 ,经 过 流水 线 的 处 理 , 从 另 一 端 流出 。 

图 12.4 是 一 种 流水 线 的 连接 图 表示 方法 。 这 里 一 条 指令 的 执行 过 程 分 为 取 指令 . 译 
码 ,执行 ,保存 结果 4 个 流水 段 。 目 前 ,大 部 分 处 理 机 的 指令 流水 线 在 3 一 12 段 之 间 。 

入 一 ~[ 取 指令 |~| 译名 上 ~[ 执行 |-~| 存 结果 | 一 出 
An An An An 





























图 12.4 4 段 指令 流水 线 


有 些 复 杂 的 指令 在 执行 阶段 也 采用 流水 线 方式 工作 ,这 种 流水 线 称 为 操作 流水 线 或 功 
能 部 件 流 水 线 。 图 12.5 是 一 个 浮 点 加 法 器 的 4 段 流水 线 , 它 将 浮 点 加 法 的 执行 过 程 分 解 为 


流水 线 抽 大 


求 阶 差 ,对 阶 . 尾 数 加 、 规 格 化 4 个子 过 程 ,每 一 个 子 过 程 可 以 在 各 自 独立 的 功能 部 件 上 


完成 。 





























入 一 |[ 求 阶 差 |~| 对 阶 |~[ 尾数 加 |-~[ 规格 化 | 一 出 
Ai Ar Ai Ar 
图 12.5 浮 点 加 法 器 流水 线 


在 图 12.5 中 ,各 个 部 件 的 执行 时 间 都 是 Ai, 虽然 执行 一 次 浮 点 加 法 的 时 间 仍 需要 4At， 
然而 由 于 4 个 部 件 同时 工作 ,每 隔 一 个 At 就 能 够 完成 一 次 浮 点 加 法 ,输出 一 个 运算 结果 。 
因此 ,采用 4 级 流水 线 的 浮 点 加 法 器 ,处理 机 执行 浮 点 加 法 的 速度 能 提高 3 倍 。 

为 了 直观 描述 流水 线 的 工作 过 程 ,最 常用 的 一 种 方法 是 采用 时 空 图 。 例 如 图 12.4 所 示 
的 指令 流水 线 , 当 采用 时 空 图 表示 时 ,如 图 12. 6 所 示 。 

号 
空间 
存 结果 
执行 
译 码 
取 指 仿 国 a 


hh HH & Bh & % «4 


图 12.6 指令 流水 线 时 空 图 

















7 4 时间 1 


在 时 空 图 中 , 横 坐 标 表示 时 间 ,也 就 是 输入 到 流水 线 中 的 各 个 任务 在 流水 线 中 所 经 过 的 
时 间 。 当 流水 线 中 各 个 流水 段 的 执行 时 间 都 相等 时 , 横 坐 标 被 分 割 成 相等 长 度 的 时 间 段 。 
纵 坐标 表示 空间 , 即 流水 线 的 每 一 个 流水 段 。 图 12.6 中 ,第 1 条 指令 厂 在 如 时 刻 进 入 流水 
线 , 在 时 刻 流出 流水 线 。 第 2 条 指令 在 妃 时 刻 进 入 流水 线 , 在 6 时 刻 流出 流水 线 。 依 此 类 
推 ,每 经 过 一 个 At 时 间 , 便 有 一 条 指令 进入 流水 线 , 同 时 也 有 一 条 指令 流出 流水 线 。 由 
图 12.6 看 出 , 当 4s 二 8At 时 ,流水 线 上 便 有 5 条 指令 输出 。 

如 果 不 采 用 流水 方式 ,而 采用 串 行 方式 执行 指令 ,如 图 12.6 中 用 网 点 表示 的 五 和 无 指 令 
的 组 合 情 况 , 当 和 二 8At 时 ,只 执行 了 2 条 指令 。 可 见 流 水 方式 成 倍 提高 了 计算 机 的 运行 效率 。 


12.1.3 流水 线 的 将 点 


从 上 面 的 分 析 可 以 看 到 ,计算 机 中 采用 流水 线 方式 与 采用 传统 的 串 行 方式 相 比 较 ,具有 
如 下 特点 。 

第 一 ,把 一 个 任务 (一 条 指令 或 一 个 操作 ) 分 解 为 几 个 有 联系 的 子 任务 ,每 个 子 任务 由 一 
个 专门 的 功能 部 件 来 实现 。 所 以 ,流水 线 实际 上 是 把 一 个 大 的 功能 部 件 分 解 为 多 个 独立 的 
功能 部 件 , 并 依靠 多 个 功能 部 件 并 行 工作 来 缩短 程序 的 执行 时 间 。 

第 二 ,流水 线 每 一 个 功能 段 部 件 后 面 都 要 有 一 个 缓冲 寄存 器 ( 锁 存 器 ) ,其 作用 是 保存 本 
流水 段 的 结果 ,如 图 12.7 所 示 。 由 于 流水 线 中 每 一 个 流水 段 的 延迟 时 间 不 可 能 绝对 相等 ， 
再 加 上 电路 的 延迟 时 间 和 时 钟 等 都 存在 偏 移 ,因此 流水 段 之 间 传 送 任务 时 ,必须 通过 锁 
存 器 。 
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图 12.7 流水线 中 的 锁 存 器 


第 三 ,流水 线 中 各 功能 段 的 延迟 时 间 应 尽量 相等 ,否则 将 引起 堵塞 、 断 流 。 执 行 时 间 长 
的 一 个 流水 段 将 成 为 整个 流水 线 的 瓶颈 ,流水 线 中 的 其 他 功能 部 件 不 能 充分 发 挥 作 用 。 

第 四 ,只 有 连续 不 断 地 提供 同一 种 任务 时 才能 发 挥 流水 线 的 效率 , 即 流水 线 中 处 理 的 必 
须 是 连续 任务 。 在 采用 流水 线 方式 工作 的 处 理 机 中 ,特别 是 当 流 水 线 的 级 数 较 多 时 ,要 在 软 
件 和 硬件 设计 等 多 方面 尽量 为 流水 线 提供 连续 的 任务 , 才 可 能 提高 流水 线 的 效率 。 

第 五 ,流水 线 需 要 有 装 人 时 间 和 排 空 时 间 。 装 人 时 间 是 指 第 一 个 任务 进入 流水 线 到 输 
出 流水 线 的 时 间 。 排 空 时 间 是 指 最 后 一 个 任务 进入 流水 线 到 输出 流水 线 的 时 间 。 在 这 两 种 
情况 下 ,流水 线 不 满载 。 只 有 流水 线 完 全 满载 时 ,整个 流水 线 的 效率 才能 得 到 充分 发 挥 。 


12.1.4 流水 线 的 分 类 方法 


根据 不 同 的 分 类 标准 ,可 以 把 流水 线 分 成 多 种 不 同 的 种 类 。 平 时 所 说 的 某 种 流水 线 ,都 
是 按照 某 种 观点 ,或 者 从 某 个 特定 角度 对 流水 线 进行 分 类 的 结果 。 下 面 就 从 几 个 不 同 的 角 
度 介 绍 一 下 流水 线 的 基本 分 类 方法 。 

1. 部 件 功 能 级 .处 理 机 级 和 处 理 机 之 间 级 流水 线 

根据 使 用 流水 线 的 级 别 差 异 .可 以 把 流水 线 分 为 部 件 功能 级 .处 理 机 级 和 处 理 机 之 间 级 
等 多 种 流水 线 类 型 。 

(1) 所 谓 功 能 部 件 级 流水 线 也 可 以 称 为 运算 操作 流水 线 (Arithmetic Pipelines)。 图 
12.5 中 的 浮 点 加 法 器 就 是 一 种 典型 的 功能 部 件 级 流水 线 。 要 提高 执行 部 件 执行 算术 逻辑 
运算 操作 的 速度 ,除了 在 运算 操作 部 件 中 采用 流水 线 之 外 ,还 可 以 设置 多 个 独立 的 操作 部 
件 , 并 通过 这 些 操作 部 件 的 并 行 工 作 来 提高 处 理 机 执行 算术 逻辑 运算 的 速度 。 通 常 , 把 指令 
执行 部 件 中 采用 了 流水 线 的 处 理 机 称 为 流水 线 处 理 机 或 超 流水 线 处 理 机 ;而 把 指令 执行 部 
件 中 设置 有 多 个 操作 部 件 的 处 理 机 称 为 多 操作 部 件 处 理 机 或 超标 量 计算 机 。 

(2) 所 谓 处 理 机 级 流水 线 , 又 叫 指令 流水 线 (Instruction Pipelines) , 它 是 把 执行 指令 的 
过 程 按 照 流水 方式 处 理 . 使 处 理 机 能 够 重 琶 地 执行 多 条 指令 , 即 把 一 条 指令 的 执行 过 程 分 解 
为 多 个 子 过 程 ,每 个 子 过 程 在 一 个 独立 的 功能 部 件 中 完成 。 本 章 将 重点 介绍 指令 流水 线 。 

(3) 所 谓 处 理 机 之 间 流 水 线 , 又 被 称 为 宏 流 水 线 (Macro Pipelines)。 图 12. 8 是 一 种 宏 
流水 线 的 示意 图 .这 种 流水 线 由 两 个 或 者 两 个 以 上 的 处 理 机 通过 存储 器 串 行 连接 起 来 ,每 个 
处 理 机 对 同一 数据 流 的 不 同 部 分 分 别 进行 处 理 ,前 一 个 处 理 机 的 输出 结果 存 和 人 存储 器 中 , 作 
为 后 一 个 处 理 机 的 输入 ,每 个 处 理 机 完成 整个 任务 的 一 部 分 。 这 一 般 属于 异 构 型 多 处 理 机 
系统 , 它 对 提高 各 个 处 理 机 的 效率 有 很 大 的 作用 。 











输入 [处理 机 1|-~( 在 储 吕 -=| 处 理 机 2| -~ 人 (在 储 器 -一 … -| 处 理 机 7 ma 
功能 任务 | 任务 2 任务 n 
图 12.8 一 种 宏 流水 线 





























2. 单 功能 流水 线 和 多 功能 流水 线 

根据 流水 线 能 够 完成 的 功能 来 分 类 ,可 以 将 流水 线 分 成 单 功能 流水 线 和 多 功能 流水 线 。 

(1) 如 果 一 条 流水 线 只 能 完成 一 种 固定 的 功能 ,这 种 流水 线 称 为 单 功 能 流水 线 
(Unifunction Pipelines)。 例 如 前 面 介 绍 的 浮 点 加 法 器 流水 线 专门 完成 浮 点 加 法 运算 。 当 
要 完成 多 种 不 同 功能 时 ,可 以 采用 多 条 单 功能 流水 线 。 如 Pentium 处 理 机 有 2 条 5 段 的 32 
位 整数 运算 流水 线 和 一 条 8 段 的 浮 点 运算 流水 线 。 

(2) 多 功能 流水 线 (Multifunction Pipelines) 是 指 流 水 线 的 各 段 可 以 进行 不 同 的 连接 。 
在 不 同时 间 内 ,或 者 在 同一 时 间 内 ,通过 不 同 的 连接 方式 实现 不 同 的 功能 。 多 功能 流水 线 的 
典型 代表 是 Texas 公司 ASC 中 采用 的 8 段 流水 线 。 在 一 台 ASC 处 理 机 内 有 4 条 相同 的 流 
水 线 , 每 条 流水 线 通过 不 同 的 连接 方式 可 以 完成 整数 加 减法 运算 、 整 数 乘除 法 运算 、 浮 点 加 
法 运算 和 浮 点 乘法 运算 等 功能 。 图 12. 9 中 给 出 了 TI-ASC 的 流水 线 分 段 示 意图 和 实现 两 
种 不 同 功 能 的 连接 方式 。 
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图 12.9 TIASC 计算 机 的 多 功能 流水 线 


3. 静态 流水 线 和 动态 流水 线 

在 多 功能 流水 线 中 ,按照 在 同一 时 间 内 是 否 能 够 连接 成 多 种 方式 ,同时 执行 多 种 功能 ， 
可 以 把 多 功能 流水 线 分 为 静态 流水 线 和 动态 流水 线 两 种 。 

(1) 静态 流水 线 (Static Pipelines) 是 指 在 同一 段 时 间 内 ,多 功能 流水 线 中 的 各 个 功能 段 
只 能 够 按照 一 种 固定 的 方式 连接 ,实现 一 种 固定 的 功能 。 只 有 当 按 照 这 种 连接 方式 工作 的 
所 有 任务 都 流出 流水 线 之 后 ,多 功能 流水 线 才能 重新 进行 连接 ,从 而 实现 其 他 功能 。 

(2) 动态 流水 线 (Dynamic Pipelines) 是 指 在 同一 段 时 间 内 .多 功能 流水 线 中 的 各 段 可 
以 按照 不 同 的 方式 连接 ,同时 执行 多 种 功能 。 这 种 同时 实现 多 种 连接 方式 是 有 条 件 的 , 即 流 
水 线 中 的 各 个 功能 部 件 之 间 不 能 发 生 冲 突 。 

前 面 介 绍 的 TLASC 的 8 段 流 水 线 . 如 果 按 照 图 12. 10(a) 中 的 时 空 图 工作 ,就 是 一 种 静 
态 流水 线 。 开 始 时 ,多 功能 流水 线 按照 实现 浮 点 加 减法 的 方式 连接 , 当 个 浮 点 加 减法 全 部 
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执行 完成 ,而 且 最 后 一 个 浮 点 加 减法 运算 的 排 空 操作 也 做 完 之 后 ,多 功能 流水 线 才 重新 开始 
按照 实现 定点 乘法 的 方式 进行 连接 .并 开始 做 定点 乘法 运算 。 如 果 按 照 图 12. 10(b) 中 的 时 
空 图 工作 ,就 是 一 种 动态 流水 线 。 如 图 12. 10(b) 所 示 , 中 间 有 一 段 时 间 , 在 同一 条 多 功能 流 
水 线 的 不 同 功能 段 中 同时 执行 浮 点 加 减法 和 定点 乘法 两 种 运算 , 即 在 浮 点 加 减法 运算 还 没 
有 全 部 完成 的 情况 下 ,定点 乘法 运算 就 已 经 开始 了 。 两 种 运算 同时 在 同一 条 多 功能 流水 线 
中 分 别 使 用 不 同 的 功能 段 。 
Ss 
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(b) 动态 流水 线 时 空 图 
图 12.10 静态 流水 线 和 动态 流水 线 








在 静态 流水 线 中 ,只 有 程序 中 连续 出 现 同一 种 运算 时 ,流水 线 的 效率 才能 充分 发 挥 出 
来 。 如 果 输 入 到 流水 线 的 是 一 串 不 同 运算 相互 间隔 的 操作 ,例如 输入 的 是 浮 点 加 、 定 点 乘 、 
学 点 加 、 定 点 乘 …… ,那么 这 条 静态 流水 线 的 效率 就 与 顺序 执行 方式 没有 区 别 了 。 而 动态 流 
水 线 则 不 同 , 它 允许 两 种 运算 在 同一 条 流水 线 中 同时 执行 。 因 此 ,在 一 般 情况 下 ,动态 流水 
线 的 效率 和 功能 部 件 的 利用 率 比 静态 流水 线 高 。 当 然 ,动态 流水 线 的 控制 比 静 态 流水 线 也 
要 复杂 得 多 。 目 前 ,大 多 数 处 理 机 中 采用 的 都 是 静态 流水 线 。 

4. 线性 流水 线 和 非 线性 流水 线 

根据 流水 线 的 各 个 功能 段 之 间 是 否 有 反馈 信号 ,可 以 把 流水 线 分 为 线性 流水 线 和 非 线 
性 流水 线 两 类 。 

(1) 线性 流水 线 (Linear Pipelines) 是 将 流水 线 的 各 段 串 行 连接 起 来 ,没有 反馈 回路 。 
输入 数据 从 流水 线 的 一 端 进入 ,从 另 一 端 输出 。 数 据 在 流水 线 的 各 个 功能 段 流 过 时 ,每 个 功 
能 段 都 流 过 且 仅 流 过 一 次 。 前 面 例子 中 提 到 的 基本 上 都 是 线性 流水 线 。 


流水 线 抽 大 


(2) 非 线 性 流水 线 (Nonlinear Pipelines) 则 是 在 流水 线 的 各 个 功能 段 之 间 除 了 有 串 行 
的 连接 之 外 ,还 有 反馈 回路 。 图 12. 11 就 是 一 个 简单 的 非 线 性 流水 线 。 虽 然 它 由 4 段 Si 一 
S: 组 成 ,但 由 于 反馈 回路 的 存在 ,在 一 次 流水 过 程 中 ,有 的 段 可 能 要 多 次 被 使 用 ,比如 从 输入 
到 输出 就 可 能 依次 流 过 S1、S、S;、Ss 、S。、S: 各 段 ,Ss、Ss 就 分 别 被 使 用 了 两 次 。 
反馈 回路 


A 可]- 从 -5]- 扣 -5]- 信 -区 


输出 
图 12.11 非 线 性 流水 线 


由 于 非 线性 流水 线 的 特点 , 它 经 常用 于 递归 调用 或 者 构成 多 功能 流水 线 等 。 非 线性 流 
水 线 中 的 一 个 重要 问题 是 要 确定 在 什么 时 间 可 以 向 流水 线 中 输入 新 的 任务 ,使 新 输入 任务 
与 流水 线 中 原来 的 反馈 任务 之 间 在 各 个 功能 段 上 都 不 产生 冲突 。 这 就 是 非 线 性 流水 线 的 调 
度 问 题 ,这 里 就 不 详细 介绍 了 。 


12.2 流水 线 的 性 能 指标 


衡量 流水 线性 能 的 主要 指标 有 吞吐 率 、 加 速 比 和 效率 。 另 外 ,在 流水 线 设计 中 ,流水 线 
的 最 佳 段 数 的 选择 也 是 一 个 重要 问题 。 下 面 就 以 线性 流水 线 为 例 ,分 析 流 水 线 的 主要 性 能 
指标 。 其 分 析 方 法 和 有 关公 式 也 适用 于 非 线 性 流水 线 。 


12.2.1 流水 线 的 吞吐 率 


吞吐 率 (Throughput Rate) 是 衡量 流水 线 速度 的 重要 指标 。 它 是 指 在 单位 时 间 内 流水 
线 所 完成 的 任务 数量 ,或 是 输出 结果 的 数量 ,计算 流水 线 吞 吐 率 的 最 基本 的 公式 表示 为 


TP= (12.5) 
大 


式 中 ,nn 为 任务 数 ,T 为 处 理 完成 个 任务 所 用 的 时 间 。 下 面 就 根据 流水 线 中 各 段 执行 
时 间 是 否 相等 分 别 对 流水 线 的 吞吐 率 进 行 讨论 。 

1. 各 段 执行 时 间 均 相等 的 流水 线 

图 12. 12 是 各 段 执行 时 间 均 相等 的 流水 线 时 空 图 。 当 输入 到 流水 线 中 的 任务 是 连续 的 
理想 情况 ,一 条 k 段 线性 流水 线 能 够 在 k 十 n 一 1 个 时 钟 周期 内 完成 个 任务 。 
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图 12. 12 各 段 执行 时 间 均 等 的 流水 线 时 空 图 
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从 流水 线 输 出 端 看 ,用 4 个 时 钟 周期 输出 第 一 个 任务 ,其余 2 一 1 个 时 钟 周期 ,每 个 时 钟 
周期 输出 一 个 任务 , 即 用 2 一 1 个 时 钟 周期 输出 * 一 1 个 任务 。 因 此 ,流水 线 完 成 个 连续 任 
务 需要 的 总 时 间 为 

Ti= (k++n— DAt 20 

式 中 ,k 为 流水 线 的 段 数 ,A 为 时 钟 周期 。 将 式 (12.6) 代 入 式 (12. 5) 中 ,得 流水 线 的 实 

际 否 吐 率 为 


7 
TP- fs (12.7) 

当 连 续 输入 的 任务 n 一 oo 时 ,得 最 大 吞吐 率 为 
TP。。 = lim 可 (12.8) 








mm (十 1 一 1])A At 
毫 无 疑问 ,流水 线 的 实际 否 吐 率 要 小 于 最 大 吞吐 率 , 它 除了 与 时 钟 周期 At 有 关外 ,还 与 
流水 线 的 段 数 k、 输 入 到 流水 线 中 的 任务 数 等 有 关 。 只 有 当 n 二 二 kh 时, 才 有 TPTPwox。 
2. 各 段 执行 时 间 不 相等 的 流水 线 
图 12. 13(a) 表 示 各 段 执行 时 间 不 相等 的 流水 线 ,其 中 第 2 段 的 执行 时 间 是 其 他 各 段 执 
行 时 间 的 3 倍 。 在 这 种 情况 下 ,流水 线 的 时 空 图 如 图 12. 13(b) 所 示 。 其 中 Si 、Ss .Si 各 段 中 
的 灰色 部 分 表示 该 段 流水 线 在 这 一 段 时 间 内 是 空闲 的 ,而 S$* 段 没有 任何 空闲 ,因此 S: 段 成 
为 瓶颈 段 。 





输入 一 | S| 5， | 5 | 5S， 一 输出 
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图 12.13 各 段 执行 时 不 相等 的 流水 线 时 空 图 


流水 线 存在 瓶颈 段 的 情况 下 ,实际 吞吐 率 为 
TP=— 2 (12.9) 
十 (一 1D)max(An Ats,*, At) 
i=1 
分 母 中 的 第 一 部 分 是 流水 线 完 成 第 1 个 任务 所 用 时 间 . 第 二 部 分 是 完成 其 余 "一 1 个 任 
务 所 用 时 间 。 此 时 流水 线 的 最 大 吞吐 率 为 
1 


TP = 一 一 一 一 一 一 (12. 10) 
max(Ai ,Atz ,At) 


对 于 图 12. 13 所 示 的 例子 ,流水线 的 最 大 吞吐 率 为 








= 
3At 


从 上 述 表 达 式 看 出 , 当 流 水 线 中 各 流水 段 执行 时 间 不 相等 时 ,流水 线 的 最 大 吞吐 率 与 实 
际 吞 吐 率 主 要 是 由 执行 时 间 最 长 的 那个 流水 段 决定 。 这 个 流水 段 就 成 了 整个 流水 线 的 撼 
颈 。 此 时 ,瓶颈 流水 段 一 直 处 于 忙碌 状态 ,而 其 余 各 段 有 许多 空闲 时 间 , 这 是 一 种 资源 浪费 。 

解决 流水 线 瓶颈 问题 有 2 种 可 行 方法 。 一 种 方法 是 将 流水 线 的 瓶颈 部 分 再 细 分 ,如 图 
12.14 所 示 , 即 把 第 2 个 流水 段 再 划分 为 3 个 子 流水 段 ,分别 命 名 为 Ss。、Sw、S2。, 使 每 一 个 
流水 段 和 子 流 水 段 的 执行 时 间 均 为 A。 


TP mx (12. 11) 





给 大 = 二 | 5 sl| 5 el So | 5 |  | 上 上 志 输 出 
A |! J Ar Ar 


图 12.14 瓶颈 流水 段 再 次 细 分 












































第 二 种 方法 : 由 于 结构 等 方面 的 原因 ,瓶颈 段 不 能 再 细 分 时 ,可 通过 重复 设置 瓶颈 流水 
段 ,让 多 个 瓶颈 流水 段 并 行 工作 。 如 图 12. 15(a) 表 示 流 水 线 连 接 图 ,图 12. 15(b) 是 流水 线 
时 空 图 。 两 种 流水 线 的 最 大 吞吐 率 同 样 为 


TPm: = (12. 12) 
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图 12.15 瓶颈 流水 段 重 复 设置 的 流水 线 


采用 瓶颈 段 资源 重复 设置 的 方法 ,其 缺点 是 控制 巡 辑 比较 复杂 。 如 图 12. 15(a) 所 示 , 从 流 
水 段 S1 到 流水 段 S: 的 各 并 列 流水 段 之 间 需 要 设置 一 个 数据 分 配器 。 它 的 任务 是 从 Si; 输出 
的 第 一 个 任务 分 配给 S;, ,从 Si 输出 的 第 二 个 任务 分 配给 Sm, 从 Si 输出 的 第 3 个 任务 分 配 
给 Ss。.。 之 后 依次 重复 。 同样 ,并 列 流水 段 SSx 、Sz 到 流水 段 S: 之 间 需 要 设置 一 个 数据 
收集 器 ,分 时 收集 前 者 的 数据 并 输入 到 流水 段 S; 中 。 
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12.2.2 流水 线 的 加 速 比 


完成 同样 一 批 任务 ,不 使 用 流水 线 所 用 的 时 间 与 使 用 流水 线 所 用 的 时 间 之 比 称 为 流水 
线 的 加 速 比 (Speedup Ratio) 。 
设 T, 表 示 不 使 用 流水 线 , 即 顺序 执行 所 用 的 时 间 , Ti 表示 使 用 流水 线 时 的 执行 时 间 , 则 
流水 线 加 速 比 S 的 基本 公式 为 
_T 
Ts 
如 果 流 水 线 各 段 执 行 时 间 都 相等 , 则 一 条 & 段 流水 线 完 成 个 连续 任务 所 需 的 时 间 为 
Ti 三 (& 十 n 一 1)At。 而 不 使 用 流水 线 , 即 顺序 执行 个 任务 时 , 则 所 需 的 时 间 为 To 二 &*，n。 
AL, 将 To 和 Ti 值 代入 式 (12.13), 得 实际 加 速 比 为 
knAt kn 


S (12. 13) 





Sn ktm=1 (12.14) 
上 述 情况 下 的 最 大 加 速 比 为 
a kn = 
Su (12. 15) 


从 式 (12. 15) 中 看 出 ' 当 7 之 > 时 ,线性 流水 线 的 各 段 执 行 时 间 均 相等 的 情况 下 ,流水 
线 的 最 大 加 速 比 等 于 流水 线 的 段 数 。 


12.2.3 流水 线 的 效率 


流水 线 的 设备 利用 率 称 为 流水 线 的 效率 (Efficiency) 。 在 时 空 图 上 ,流水 线 的 效率 定义 
为 完成 n 个 任务 占用 的 时 空 区 有 效 面积 与 个 任务 所 用 的 时 间 与 & 个 流水 段 所 围 成 的 时 空 
区 总 面积 之 比 。 因 此 ,流水 线 的 效率 包含 了 时 间 和 空间 两 个 因素 。 

nn 个 任务 占用 的 时 空 区 有 效 面积 就 是 顺序 执行 个 任务 所 使 用 的 总 的 时 间 T,, 而 个 
任务 所 用 的 时 间 与 A 个 流水 段 所 围 成 的 时 空 区 总 面积 为 kT ,其 中 T 是 流水 线 完成 个 任 
务 所 使 用 的 总 时 间 , 计 算 流水 线 效率 的 一 般 公 式 可 以 表示 为 


_ nn 个 任务 占用 的 时 空 区 有 效 面积 a 
元 个 任务 所 用 的 时 间 与 人 个 流水 眉 所 有 的 时 空 区 总 面积 ”RTs 


如 果 流 水 线 的 各 段 执行 时 间 均 相等 ,而 且 输 入 的 nn 个 任务 是 连续 的 , 则 一 条 上 有 段 流水 线 
的 效率 为 














E knAt n 
kl(k+n—1l)At kn—l 


式 中 ,分 子 部 分 是 完成 个 任务 实际 占用 的 有 效 面积 ,分母 部 分 是 完成 个 任务 所 用 的 
时 间 与 个 流水 段 所 围 成 的 总 面积 。 因 此 .通过 时 空 图 来 计算 流水 线 的 效率 非常 方 使。 
在 流水 线 的 各 段 执行 时 间 均 相等 ,输入 到 流水 线 的 任务 是 连续 的 情况 下 ,流水 线 的 最 高 


(12. 17) 


而 三 下 二 二 一- 一 
ok 十 n 一 1 

显然 , 当 "一 > 时 ,流水 线 的 效率 达到 最 大 值 1。 这 时 流水 线 的 各 段 均 处 于 忙碌 状态 。 
从 时 空 图 中 也 可 以 看 出 , 当 n>co 时 分 子 和 分 母 两 部 分 的 时 空 区 面积 接近 于 相等 。 


于 (12. 18) 


流水 线 扒 大 


根据 式 (12.17) 和 式 (12.7) ,也 可 以 得 到 式 (12. 19), 即 当时 钟 周期 不 变 时 ,流水 线 的 效 
率 与 春 吐 率 成 正比 , 即 
E= TPAt (12. 19) 
根据 式 (12.17) 和 式 (12. 14), 可 以 得 出 式 (12. 20) ,此 式 表示 流水 线 的 效率 巨 是 流水 线 
实际 加 速 比 S 与 它 的 最 大 加 速 比 & 之 比 。 只 有 当 效 率 下 达到 最 大 值 即 下 = 王 1 时 ,才能 使 实 
际 加 速 比 达到 最 大 , 即 S 一 A。 


三 过 | 
E=2 (12. 20) 


如 果 流 水 线 的 各 段 执行 时 间 不 相等 , 则 除 瓶 颈 流 水 段 外 ,其 他 各 流水 段 都 有 空闲 时 间 ， 
这 些 流水 段 的 效率 没有 得 到 充分 发 挥 ,因此 整个 流水 线 的 效率 下 比较 低 。 


12.2.4 流水 线 的 最 佳 段 数 


从 上 节 分 析 看 到 ,增加 流水 线段 数 k 时 ,流水 线 的 否 吐 率 和 加 速 比 都 能 提高 。 但 是 每 一 
流水 段 输出 端 必须 设置 一 个 锁 存 器 , 当 流 水 段 数 增多 时 , 锁 存 器 的 总 延迟 时 间 也 将 增加 ,其 
至 有 可 能 出 现 锁 存 器 的 总 延迟 时 间 超 过 流水 线 本 身 的 延迟 时 间 , 并 且 流 水 线 的 价格 也 会 增 
加 。 为 此 ,要 综合 考虑 各 方面 的 因素 ,根据 总 体 性 能 价格 比 来 选择 流水 线 最 佳 段 数 。 

目前 ,一 般 处 理 机 中 的 流水 线段 数 在 3 一 12 之 间 , 极 少 有 超过 15 段 的 流水 线 。 一 般 把 
8 段 或 超过 8 段 的 流水 线 称 为 超 流水 线 , 采 用 8 段 以 上 流水 线 的 处 理 机 有 时 也 称 为 超 流水 
线 处 理 机 。 


12.3 DLX 指令 集 与 DLX 流水 线 


为 了 说 明 流 水 线 的 实现 原理 和 讨论 流水 线 中 的 相关 问题 ,需要 用 到 一 种 称 为 DLX 的 指 
令 集结 构 , 本 节 首 先 对 DLX 指令 集结 构 进行 简要 介绍 ,并 给 出 DLX 的 一 种 简单 的 实现 。 

DLX( 读 作 Deluxe) 是 一 种 Load 一 Store 型 指令 集结 构 。 所 谓 Load 一 Store 型 又 称 为 寄 
存 器 一 寄存 器 型 .是 指 对 通用 寄存 器 型 指令 集 而 言 , 其 所 有 的 ALU 指令 都 不 包含 存储 器 操 
作 数 。 与 大 多 数 当 今 的 计算 机 类 似 ,DLX 强调 : 简单 的 Load 一 Store 指令 集 ; 设 计 上 重视 流 
水 线 效 率 ,包括 固定 长 度 指令 编码 ;使 编译 器 更 容易 产生 高 效 的 目标 代码 。 


12.3.1 DLX 指令 集结 构 介 绍 


1. DLX 的 寄存 器 

DLX 使 用 32 个 32 位 的 通用 寄存 器 (GPR) ,分 别 命名 为 RO,R1,R2,…, R31。 另 外 还 
有 一 组 浮 点 寄存 器 (FPR) ,这 些 浮 点 寄存 器 既 可 以 作为 32 个 32 位 的 单 精 度 寄存 器 ,命名 为 
FO0,F1,F2,…,F31, 也 可 以 由 相 邻 的 偶数 号 和 奇数 号 寄存 器 配对 构成 双 精 度 寄存 器 ,这 种 组 
合 的 双 精 度 浮 点 寄存 器 在 DLX 中 被 命名 为 F0.F2,…,F28.,F30。 

寄存 器 RO 的 值 总 是 0, 后 面 会 介绍 利用 该 寄存 器 实现 一 些 有 用 的 操作 ,还 有 一 些 特殊 
的 寄存 器 实现 特定 的 功能 。 

2. DLX 的 数据 类 型 

DLX 提供 了 多 种 长 度 的 整 型 数据 和 浮 点 数据 ,包括 8 位 字 节 、16 位 半 字 、32 位 整数 字 ， 
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以 及 32 位 单 精度 和 64 位 双 精 度 浮 点 数 。 

DLX 的 操作 是 面向 32 位 的 整数 以 及 32 位 或 者 64 位 的 浮 点 数 的 。 字 节 或 者 半 字 在 调 
入 到 32 位 寄存 器 时 ,用 0 或 者 符号 位 来 填充 32 位 寄存 器 的 剩余 部 分 。 一 旦 载 和 人 ,就 将 其 作 
为 32 位 整 型 数据 进行 处 理 。 

3. DLX 的 寻 址 方式 和 数据 传输 

DLX 可 以 提供 寄存 器 寻 址 .立即 数 寻 址 、 偏 移 寻 址 和 寄存 器 间接 寻 址 4 种 寻 址 方式 , 寄 
存 器 寻 址 字段 的 大 小 是 5 位 ,用 于 标识 32 个 通用 寄存 器 或 者 浮 点 寄存 器 。 

DLX 的 内 存 按 字 节 寻 址 ,地 址 宽度 为 32 位 ,而 且 用 32 位 地 址 的 高 位 字 节 在 先 的 格式 
寻 址 。DLX 是 一 种 Load 一 Store 结构 , 它 通过 寄存 器 (GPR 和 FPR) 和 存储 器 之 间 的 数据 
传送 完成 对 存储 器 的 访问 。 

由 于 DLX 支持 上 述 的 所 有 数据 类 型 ,所 以 与 GPR 有 关 的 内 存 存 取 可 以 是 一 个 字 节 一 
个 半 字 或 者 一 个 字 ,FPR 可 以 加 载 或 者 存储 单 精度 字 或 者 双 精 度 字 。 

4. DLX 的 指令 格式 

由 于 DLX 的 寻 址 方式 很 少 ,DLX 的 寻 址 方式 被 编码 到 指令 操作 码 中 。 为 了 简化 指令 
译 码 以 及 更 容易 进行 流水 线 操作 ,所 有 的 指令 都 是 32 位 字 长 的 ,其 中 6 位 用 来 表示 操作 码 。 
图 12.16 给 出 了 DLX 指令 的 IR 和 J 3 种 类 型 的 指令 格式 ,所 有 的 指令 都 依照 这 3 种 类 型 
来 编码 。 

6 5 16 
操作 码 op | 源 寄存 器 1 rs， | 目的 寄存 器 rd 立即 数 


字 节 、 半 字 、 字 的 加 载 和 存储 ; 
rd 一 rsi op 立即 数 。 








(a) I 型 指令 
6 5 1 $ 过 
操作 码 op 。 | 源 寄存 器 1 rs，| 源 寄存 器 2 rs，| 目的 寄存 器 rd 函数 
人 人 rd 一 rs Func rs;; 
数据 的 操作 进行 编码 : 加 、 减 … 
LE 写 和 移动 


























Rp 与 PC 相 加 的 偏 移 量 
跳 转 ， 跳 转 并 链接 ， 陷 阱 和 意外 返回 。 
(0) J 型 指令 
图 12.16 DLX 的 指令 格式 





5. DLX 的 操作 介绍 

DLX 除了 支持 上 面 提 到 的 一 些 简单 操作 ,还 有 一 些 其 他 操作 。DLX 指令 大 致 可 以 分 
为 4 大 类 , 即 Load 一 Store 操作 、ALU 操作 ,分 支 和 跳 转 操 作 以 及 浮 点 数 操作 。 为 了 对 这 些 
操作 类 型 的 论述 方便 ,这 里 先 对 指令 含义 的 表示 方法 约定 如 下 。 

(1) 符号 "<” 表 示 数 据 传送 操作 , 当 传 送 的 数据 位 数 不 确 切 时 ,后 面 附带 一 个 下 标 , 例 
如 ”< ”表示 传送 一 个 nn 位 数据 。 

(2) 上 标 表示 复制 一 个 域 .例如 ,通过 “0”*” 可 以 得 到 一 个 24 位 全 是 0 的 域 。 

(3) 域 的 下 标 用 来 表示 从 域 中 选择 某 一 位 。 域 中 的 位 从 最 高 位 开始 标记 ,起 始 标 记 为 
0。 下 标 可 以 表示 一 个 单独 的 数字 ,如 “Regs[R4]。” 表 示 寄 存 器 R4 中 的 符号 位 ;下 标 也 可 以 


表示 一 个 范围 ,如 "Regs[R3]:..a ”表示 寄存 器 R3 中 的 最 低 一 个 字 节 。 

(4) 符号 “# # ”表示 链接 两 个 域 , 它 可 以 出 现在 数据 传送 的 任何 一 方 。 

(5) 变量 "Mem”* 用 来 表示 主 存 .按照 字 节 编 址 ,可 以 传输 任意 字 节 的 数据 。 

为 了 便于 理解 上 面 的 表示 方法 ,举例 如 下 ,假如 R8 和 R10 是 32 位 的 寄存 器 ,那么 
Regs[ R10]16..5:1<16 (Mem[ Regs[ R8]o]) 二 # (Mem[ Regs[ R8]]) 表 示 的 意思 就 是 以 R8 的 
内 容 作 为 地 址 访问 内 存 , 得 到 的 字 节 按 符号 位 扩展 到 16 位 以 后 存 人 R10 的 低 半 字 ,而 R10 
的 高 半 字 不 变 。 下 面 就 分 别 就 DLX 的 4 种 类 型 的 操作 进行 论述 。 

Load 一 Store 操作 可 以 应 用 在 所 有 的 通用 寄存 器 和 浮 点 寄存 器 上 ,分 别 进 行 载 人 和 存 
储 操作 。 但 需要 注意 的 是 对 通用 寄存 器 R0 的 Load 操作 没有 任何 效果 ,前 面 已 经 介绍 过 
了 ,R0 的 内 容 恒 为 0。 表 12. 1 给 出 了 Load 一 Store 操作 的 一 组 实例 。 


表 12.1 Load 一 Store 指令 实例 















































指令 实例 指令 名 称 指令 含义 
LW R1.30(R2) 加 载 整 型 字 Regs[R1]<-;: Mem[ 30+Regs[ R2]] 
LW R1.,1000(R0) 加 载 整 型 字 Regs[R1]< :Mem[1000 十 0] 
LB R1,40CR3) 加 载 字 节 | es )* 间 半 Mem[40 十 
LBU R1,40(R3) 加 载 无 符号 字 Regs[R1]<::02 # 并 Mem[40 十 RegsLR3]] 
to | ay。 RE TREE 
LF F0,50(R3) 加 载 单 精度 浮 点 | Regs[F0]<-3: Mem[ 50 十 Regs[LR3]] 
LD Fo,50(R2) 加 载 双 精度 浮 点 | Regs[F0]# # Regs[ Fl]<-6 Mem[50 十 Regs[R2]] 
SW 500(R4) ,R3 存储 整 型 字 Mem[500 十 Regs[R4]]< :> Regs[R3] 
SF 40(R3) ,F0 存储 单 精度 浮 点 Mem[ 40 十 Regs[R3]]<-::Regs[ FO | 
SD 40(R3) ,FO 存储 双 精度 浮 点 Mem[ 40+ Regs[ R3] ]<—;, Regs[ FO |Mem[ 44 十 RegsLR3]] 一 
2 Regs[F1] 
SH 502(R2) ,R31 存储 整 型 半 字 Mem[ 502+ Regs[ R2 | |<—1s Regs[ R31 J1e..31 
SB 41(R3) ,R2 存储 整 型 字 节 Mem[41 十 Regs[R3]]<-。Regs[R2]。 





在 DLX 指令 集结 构 中 ,所 有 的 ALU 指令 都 是 寄存 器 一 寄存 器 指令 ,包含 了 简单 的 算 
术 运 算 和 逻辑 运算 ,如 加 \ 减 .与 .或 . 异 或 和 移 位 。 所 有 这 些 指令 都 支持 立即 数 寻 址 模式 , 它 
带 有 一 个 16 位 的 符号 扩展 立即 数 。LHI( 加 载 高 位 立即 数 ) 操 作 把 立即 数 加 载 到 寄存 器 的 
高 半 部 ,而 把 低 半 部 设 为 0。 这样 可 以 通过 两 次 Load 指令 构造 一 个 32 位 的 常数 。 

在 ALU 操作 中 .R0 经 常 被 用 来 合成 通用 操作 。 加 载 一 个 常数 的 操作 可 以 由 一 个 立即 
数 和 一 个 源 操作 数 是 RO 的 加 法 来 实现 。 寄 存 器 一 寄存 器 传送 可 以 通过 其 中 一 个 源 操作 数 
是 RO 的 加 法 来 完成 。 通 常用 LHI 表示 前 者 ,而 用 MOV 表示 后 者 。 

ALU 操作 还 有 比较 两 个 寄存 器 的 比较 指令 (= .天 .二 .二 .过 .三 )。 如 果 条 件 为 真 , 则 
比较 指令 将 在 寄存 器 中 放 入 一 个 1, 否则 就 放 入 一 个 0。 由 于 这 些 操作 都 设置 寄存 器 ,因此 
它们 也 被 称 为 Set-Equal., Set-Not-Equal. Set-Less-Than 等 。 同 时 这 些 比较 指令 也 具有 立即 
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数 形式 。 表 12. 2 给 出 了 一 组 算术 和 逻辑 指令 的 例子 。 
表 12.2 ALU 指令 实例 























指令 实例 指令 名 称 指令 含义 
ADD R1,R2,R3 | 加 Regs[R1]< -Regs[R2] 十 Regs[R3] 
ADDI R1,R2 ,并 3 | 加 立即 数 Regs[R1]<-Regs[R2] 十 3 
LHI R1,+#42 加 载 立即 数 到 高 半 字 | Regs[R1]<-42 并 #0 
SLLIR1,R2,#5 | 逻辑 左 移 立 即 数 Regs[R1]< -Regs[R2] 一 一 5 
SLT R1,R2,R3 设置 小 于 If (Regs[ R2]—Regs[R3]) Regs[R1]<-1Else Regs[R1]<-0 





在 DLX 中 ,控制 由 一 组 跳 转 操作 和 一 组 分 支 操作 来 处 理 。4 种 跳 转 指令 由 指定 目的 地 
址 的 两 种 方式 以 及 是 否 进 行 链接 来 区 分 。 其 中 两 种 跳 转 指令 用 把 26 位 带 符 号 的 偏 移 量 加 
到 程序 计数 器 中 的 方法 来 确定 目的 地 址 ;另外 两 种 跳 转 指令 通过 指定 包含 目的 地 址 的 寄存 
器 来 确定 。 跳 转 有 两 种 类 型 ,一 种 是 简单 跳 转 , 另 一 种 是 跳 转 并 链接 (用 于 过 程 调用 ) 。 后 者 
将 返回 一 个 地 址 , 即 下 一 条 顺序 指令 地 址 (返回 地 址 ) ,保存 在 R31 中 。 

所 有 的 分 支 指令 都 是 条 件 分 支 指令 。 分 支 条 件 由 指令 确定 ,可 能 是 测试 源 操作 数 寄 存 器 
是 否 为 0; 源 操作 数 寄 存 器 中 可 能 有 一 个 数值 或 者 某 个 比较 结果 。 分 支 的 目标 地 址 由 26 位 带 
符号 偏 移 量 和 程序 计数 器 相 加 的 结果 决定 。 表 12. 3 给 出 了 一 组 典型 的 跳 转 和 分 支 指令 示例 。 


表 12.3 典型 的 跳 转 和 分 支 指令 

















指令 实例 指令 名 称 指令 含义 
J name 跳 转 了 PC-<-name;((PC 十 4) 一 25) 过 name<((PC 十 4) 十 225) 
Regs[ R31]<-PC+4;PC<—name; ((PC+4)—2”)<name< 
JAL name 跳 转 并 链接 (CCPC 十 4 十 25) 
JALR R2 寄存 器 型 跳 转 并 链接 | Regs[ R31]<-PC 十 4;PC<-Regs[R2] 
JR R3 寄存 器 型 跳 转 PC<—Regs[ R3] 





If(Regs[ R4]= =0) PC<—name; ((PC+ 4)—2”)<name< 
《PC 十 全 十 22) 
If(Regs[R4]!=0) PC<—name; ((PC 十 4) 一 25) 近 name 挟 
((PC+4)+2”) 


BEQZ R4,name | 等 于 0 时 分 支 





BNEZ R4,name | 不 等 于 0 时 分 支 








浮 点 操作 是 对 浮 点 寄存 器 进行 操作 的 指令 。 浮 点 指令 同时 还 指明 了 相应 的 操作 是 单 精 
度 浮 点 操作 还 是 双 精 度 浮 点 操作 。 浮 点 操作 包括 加 、 减 、 乘 、 除 。 后 级 下 表示 单 精度 浮 点 
数 ,后 级 D 表示 双 精 度 浮 点 数 ( 例 如 ADDD、ADDF、SUBD、 SUBF、MULTD、MULTF、 
DIVD、DIVF)。 浮 点 数 比 较 指 令 会 根据 比较 结果 设置 浮 点 数 状 态 寄存 器 的 某 一 位 为 1 还 是 
0, 可 以 用 两 条 分 支 指令 BFPT 和 BFPF 测试 状态 寄存 器 来 决定 是 否 进行 分 支 。 

浮 点 指令 中 ,MOVF 和 MOVD 分 别 把 一 个 单 精 度 或 者 一 个 双 精 度 浮 点 寄存 器 的 值 , 复 
制 到 另 一 个 同类 型 的 寄存 器 中 。MOVFP2I 和 MOVI2FP 在 单 精度 浮 点 寄存 器 和 整数 寄存 
器 之 间 传 送 数据 。 还 有 其 他 一 些 浮 点 指令 请 参考 后 续 的 指令 列表 。 

表 12.4 给 出 了 DLX 的 所 有 指令 和 其 含义 的 列表 。 
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表 12.4 所 有 的 DLX 指令 列表 













































































指令 类 型 指令 操作 码 指令 含义 
LB.LBU',SB 加 载 字 节 ,加 载 无 符号 字 节 ,存储 字 节 
LH.LHU.SH 加 载 半 字 , 加 载 无 符号 半 字 , 存 储 半 字 
LW.SW 加 载 字 ,存储 字 
加 载 单 精度 浮 点 数 ,加 载 双 精度 浮 点 数 ,存储 单 精度 学 
数据 传输 | TELD'SF'SD 点 数 ,存储 双 精度 浮 点 数 
MOVI2S, MOVS2I 在 通用 寄存 器 和 特殊 寄存 器 之 间 传送 数据 
将 一 个 单 精度 / 双 精 度 浮 点 寄存 器 的 内 容 复制 到 另 一 
MOVE-MOVD 个 单 精 度 / 双 精 度 浮 点 寄存 器 中 
MOVFP2I, MOVI2FP 在 整数 寄存 器 和 浮 点 寄存 器 之 间 传 送 32 位 的 数据 
ee 东 符 号 加 ,和 符号 立即 数 训 ， 无 符号 加 ,无 符号 立即 
附 号 减 , 带 符号 立 ,无 符号 减 ,无 符号 立 
SUB,SUBI,SUBU,SUBUI pss 带 符号 立即 数 减 ,无 符号 碱 ,无 符 这 
MULT, MULTU ,DIV .DIVU 带 符号 乘 , 无 符号 乘 , 带 符号 除 ,无 符号 除 
算术 /逻辑 AND,ANDI 与 ,和 立即 数 与 
OR,ORI,XOR ,XORI 或 ,和 立即 数 或 , 异 或 ,和 立即 数 异 或 
LHI 加 载 立即 数 到 高 半 字 
移 位 : 立即 数 形式 和 变量 形式 ,包括 逻辑 左 移 ,逻辑 
SLL,SRL,SRA,SLLI,SRLI,SRAI 移 和 算术 右 移 
人 一 一 了 设置 条 件 一 "可 以 是 LT,GT,LE,GE,EQ,NE 
BEQZ,BNEZ 根据 指定 通用 寄存 器 的 内 容 等 于 还 是 不 等 于 0 分 支 
BEPT, BFPF 测试 浮 点 状态 寄存 器 中 的 比较 位 为 真 还 是 假 分 支 
本 JJJR 跳 转 ,基于 寄存 器 的 跳 转 
JALJALR 跳 转 并 链接 ,基于 寄存 器 的 跳 转 并 链接 
TRAP 转 到 操作 系统 
RFE 从 异常 恢复 到 用 户 模式 
ADDD., ADDF 双 精 度 浮 点 加 , 单 精度 浮 点 加 
SUBD. SUBF 双 精 度 浮 点 减 , 单 精度 浮 点 减 
MULTD.MULTF 双 精 度 浮 点 乘 , 单 精度 浮 点 乘 
DIVD,DIVF 双 浮 点 除 , 单 精度 浮 点 除 
pe 精度 浮 点 





CVTF2D, CVTF2I, CVTD2F， 
CVTD2I,CVTI2F,CVTI2D 


转换 指令 ,CVTz2y 表示 从 类 型 x 转换 到 类 型 y, 其 中 工 
和 可 以 是 工整 型 ).D( 双 精度 浮 点 ) .F( 单 精度 浮 点 ) 








一 起 ,一 下 





双 精 度 浮 点 和 单 精度 浮 点 比较 ,“ 一 "可 以 是 LT,GT， 
LE,.GE,.EQ.NE, 根 据 比较 结果 设置 浮 点 状态 寄存 器 
中 的 位 
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12.3.2 DLX 的 一 种 简单 实现 


前 面 介绍 了 DLX 这 种 Load 一 Store 型 指令 集结 构 , 这 种 指令 集结 构 一 个 重要 的 特点 就 
是 便于 实现 指令 流水 ,为 了 说 明 如 何 流水 实现 DLX 的 指令 集结 构 , 必 须 首先 了 解 在 非 流水 
情况 下 DLX 结构 是 如 何 实现 的 。 以 下 部 分 就 介绍 一 种 简单 的 DLX 实现 方案 ,这 种 方案 使 
引入 流水 的 概念 更 加 自然 。 

图 12. 17 给 出 了 实现 DLX 指令 的 一 种 简单 的 数据 通路 ,从 图 中 可 以 看 出 ,每 一 条 DLX 
指令 的 实现 至 多 需要 5 个 时 钟 周期 。 这 5 个 时 钟 周期 分 别 介绍 如 下 。 


1 
指令 译 码 / 读 寄存 器 | 执行 /计算 地 址 
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图 12.17 DLX 数据 通路 的 实现 


1， 取 指令 周期 (IF) 

这 个 周期 的 操作 是 根据 程序 计数 器 PC 的 值 从 存储 器 中 取出 指令 ,并 将 指令 送 入 指令 
寄存 器 IR, 同 时 PC 的 值 加 4, 也 就 是 指向 顺序 的 下 一 条 指令 ,并 将 下 一 条 指令 的 地 址 放 到 
寄存 器 NPC 中 。 


IR<— Mem[PC] 
NEC< EC+ 4 


2. 指令 译 码 / 读 寄存 器 周期 (ID) 

这 个 周期 的 操作 是 进行 指令 译 码 , 读 指令 寄存 器 IR, 并 将 读 出 的 结果 放 到 两 个 临时 寄 
存 器 A 和 B 中 。 同 时 对 IR 寄存 器 内 容 的 低 16 位 进行 符号 扩展 ,然后 将 符号 扩展 后 的 32 
位 立即 数 保存 到 临时 寄存 器 Imm 中 。 

BFegs[IRen] 

BRegs[TRus] 

Je ((IRe) ## IRea) 

3. 执行 /有 效 地 址 计算 周期 (EX) 

ALU 对 上 一 个 周期 准备 好 的 操作 数 进行 操作 ,根据 DLX 指令 的 不 同类 型 执行 下 面 4 
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个 功能 中 的 一 个 。 

1) 访问 存储 器 

当 指 令 为 访问 存储 器 指令 时 ,此 周期 的 操作 是 ALU 将 操作 数 相 加 形成 有 效 地 址 ,并 将 
结果 放 到 临时 寄存 器 ALUoutput 中 。 


ALUoutput<—At+ Trm 


2) 寄存 器 一 寄存 器 ALU 操作 
当 指 令 为 寄存 器 一 寄存 器 ALU 操作 指令 时 ,此 周期 的 操作 是 ALU 根据 操作 码 标示 的 
功能 对 临时 寄存 器 A 和 B 中 的 值 进 行 处 理 , 并 将 结果 放 到 临时 寄存 器 ALUoutput 中 。 


LUcutpute RAR op B 


3) 寄存 器 一 立即 数 ALU 操作 
当 指 令 为 寄存 器 一 立即 数 ALU 操作 指令 时 ,此 周期 的 操作 是 ALU 根据 操作 码 标 示 的 
功能 对 临时 寄存 器 A 和 Imm 中 的 值 进行 处 理 , 并 将 结果 放 到 临时 寄存 器 ALUoutput 中 。 


AlDoutput— A op Im 


4) 分 支 操 作 

当 指令 为 分 支 指令 时 ,此 周期 的 操作 是 ALU 将 临时 寄存 器 NPC 和 Imm 中 的 值 进行 
相 加 ,得 到 分 支 的 目标 地 址 ,将 结果 放 到 临时 寄存 器 ALUoutput 中 。 并 对 前 一 周期 读 到 临 
时 寄存 器 A 中 的 值 进行 检查 .决定 分 支 是 否 成 功 。 关 系 操作 符 op 由 分 支 操作 码 决定 。 

ALUoutput<— NEC+ Trm 

Cond— A op 0) 

4. 存储 器 访问 /分 支 完 成 周期 (MEM) 

在 这 个 周期 可 能 进行 操作 的 DLX 指令 仅 包括 Load、Store 和 分 支 指令 。 下 面 就 访问 存 
储 器 操作 和 分 支 操作 分 别 进行 说 明 。 

1) 访问 存储 器 操作 

在 需要 访问 存储 器 的 操作 里 , 如果 是 Load 指令 ,将 从 存储 器 返回 数据 并 放 入 LMD 
(Load Memory Data) 寄 存 器 中 ;如 果 是 Store 指令 ,就 把 寄存 器 B 中 的 数据 写 入 到 存储 器 
中 。 这 两 种 情况 下 使 用 的 地 址 在 上 一 个 周期 中 计算 ,并 放 到 寄存 器 ALUoutput 中 。 


IMD- -MEm[aALDoutput] 
或 者 
MEm[MLUoutput]< 一 B 


2) 分 支 操作 

如 果 进 行 分 支 操作 ,将 被 寄存 器 ALUoutput 中 的 分 支 目 标 地 址 传送 到 程序 计数 器 PC; 
否则 将 寄存 器 NPC 中 的 内 容 传送 到 PC。 

5. 写 回 周期 (WB) 

不 同 的 指令 在 写 回 周期 完成 的 任务 也 不 一 样 ,下 面 按 照 不 同 的 指令 类 型 对 写 回 周期 要 
完成 的 操作 进行 说 明 。 
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(1) 寄存 器 一 寄存 器 型 ALU 指令 : Regs[ Re..20]<-ALUoutput。 

(2) 寄存 器 一 立即 数 型 ALU 指令 : Regs[LIR .is]<-ALUoutput。 

(3) Load 指令 : Regs[LIR is]<LMD。 

这 几 种 类 型 的 指令 都 是 将 结果 写 人 寄存 器 中 。 无 论 结 果 是 来 自 存储 器 系统 (LMD 中 
的 内 容 ), 还 是 来 自 ALU 的 计算 结果 (ALUoutput 中 的 内 容 ) ,都 由 操作 码 决定 将 其 送 入 目 
标 寄存 器 相应 的 域 中 。 

图 12.17 给 出 了 一 条 指令 是 如 何 沿 着 数据 通路 流动 的 。 在 每 一 个 时 钟 周期 结束 的 时 
候 , 所 有 在 该 时 钟 周期 计算 得 到 并 且 要 在 后 面 的 时 钟 周期 (用 于 本 条 指令 或 者 下 一 条 指令 ) 
需要 的 数据 会 被 写 人 到 存储 器 .通用 寄存 器 .PC 或 者 临时 寄存 器 等 存储 部 件 。 临 时 寄存 器 
在 不 同 的 时 钟 周期 之 间 为 同一 条 指令 保存 数据 ,而 其 他 的 存储 单元 的 状态 是 可 见 的 ,它们 在 
相 邻 的 指令 之 间 保 存 数 据 。 在 这 种 实现 方案 中 ,分 支 指令 需要 4 个 时 钟 周 期 ,而 其 他 指令 需 
要 5 个 时 钟 周期 。 


12.3.3 DLX 流水 线 的 实现 原理 


在 上 一 节 中 介绍 的 DLX 的 多 周期 实现 的 基础 之 上 ,如果 在 每 一 个 时 钟 周期 启动 一 条 新 
的 指令 ,就 可 以 使 图 12. 17 中 的 数据 通路 成 功 流水 。 而 上 一 节 中 的 每 一 个 时 钟 周期 就 是 流 
水 线 的 一 个 流水 段 , 即 流水 线 的 一 个 周期 。 下 面 采 用 流水 线 结构 的 另外 一 种 典型 表示 方法 
〈 即 流水 线 时 空 图 表示 的 另 一 种 形式 ) 来 描述 此 流水 线 中 指令 的 执行 模式 。 如 图 12. 18 所 
示 ,每 一 条 指令 经 过 5 个 时 钟 周期 执行 完成 ,而 在 每 一 个 时 钟 周期 内 ,硬件 将 启动 一 条 新 的 
指令 并 执行 5 条 不 同 指令 的 某 个 部 分 。 























时 钟 
指 令 
1 2 3 4 5 6 7 8 9 
指令 i IF ID EX MEM WB 
指令 i 十 1 正 ID EX MEM WB 
指令 i 十 2 IF ID EX MEM WB 
指令 i 十 3 IF ID EX MEM WB 
指令 i 十 4 IF ID EX MEM WB 














图 12.18 简单 的 DLX 基本 流水 线 


不 幸 的 是 ,实际 的 流水 线 远 没有 我 们 上 面 说 的 这 么 简单 。 下 面 我 们 将 对 因为 流水 而 引 
发 的 问题 进行 讨论 。 为 了 使 多 条 指令 能 够 在 流水 线 中 重 又 执行 ,就 必须 保证 在 指令 重 全 时 
不 会 存在 任何 流水 线 资源 冲突 问题 , 即 要 保证 流水 线 的 各 有 段 在 同一 个 时 钟 周期 内 不 会 使 用 
相同 的 数据 通路 资源 。 图 12. 19 给 出 了 流水 线 方式 下 简化 的 DLX 数据 通路 。 该 图 显示 了 
不 同 数据 通路 的 重生 ,其 中 周期 5(CCs ) 表 示 稳 定 状 态 。 由 于 寄存 器 在 ID 段 被 读 ,在 WB 段 
被 写 , 它 就 出 现 了 两 次 。 在 包围 每 个 流水 段 的 线 框 中 ,如 果实 线 在 右 侧 ,说 明 是 读 操作 ;如 果 
实 线 在 左 侧 , 说 明 是 写 操作 ;其 他 部 分 用 虚线 。IM 表示 指令 存储 器 ,DM 表示 数据 存储 器 ， 
CC 表示 时 钟 周期 。 

从 图 12. 19 中 还 可 以 看 到 ,主要 的 功能 部 件 都 在 不 同 的 时 钟 周期 内 使 用 ,因而 多 条 指令 
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图 12.19 随时 间 移 动 的 一 系列 数据 通路 


重 伙 执行 时 引入 的 冲突 很 少 ,这 主要 是 因为 以 下 3 个 方面 的 原因 。 

第 一 ,前 面 介绍 的 基本 数据 通路 中 使 用 了 分 开 的 指令 存储 器 (IM) 和 数据 存储 器 (DM) ， 
典型 的 实现 方式 是 采用 指令 Cache 和 数据 Cache。 这 样 设计 的 好 处 是 避免 了 取 指 令 操作 和 
访问 数据 操作 之 间 存 在 的 存储 器 访问 冲突 。 

第 二 ,在 两 个 流水 线段 都 使 用 了 寄存 器 : ID 段 读 , WB 段 写 。 这 两 个 使 用 是 截然 不 同 
的 ,所 以 我 们 在 两 个 地 方 画 出 了 寄存 器 ,那么 如 果 读 操作 和 写 操作 都 是 对 同一 个 寄存 器 进 
行 ,如何 解决 这 个 问题 我 们 后 续 将 进行 分 析 。 

第 三 ,图 12. 19 中 没有 考虑 PC 的 问题 。 为 了 在 每 一 个 时 钟 周期 能 够 启动 一 条 新 的 指 
令 ,就 需要 每 个 周期 都 对 PC 进行 自 加 运算 并 写 回 ,对 于 上 述 的 DLX 流水 线 , 这 项 工作 必须 
在 IF 段 完成 ,以 便 为 下 一 条 指令 做 好 准备 。 如 果 考 虑 到 分 支 指令 的 影响 ,就 出 现 新 的 问题 ， 
因为 分 支 指令 可 能 要 改变 PC 的 值 , 但 是 它 仅 在 MEM 段 结束 时 才 改 写 PC 值 。 针 对 这 个 问 
题 , 就 需要 对 上 述 流水 线 的 数据 通路 重新 进行 组 织 ,争取 只 在 正 段 完成 改变 PC 值 的 操作 。 
这 种 变化 实际 上 是 一 个 如 何 处 理 分 支 的 问题 ,这 个 问题 将 在 下 节 中 进行 分 析 。 

前 面 已 经 讨论 过 ,在 DLX 基本 流水 线 中 ,每 一 个 时 钟 周期 都 要 用 到 所 有 的 流水 段 , 一 个 
流水 段 中 的 所 有 操作 必须 在 一 个 时 钟 周期 内 完成 。 特 别 是 数据 通路 的 流水 要 求 从 一 个 流水 
段 到 下 一 个 流水 段 的 数据 必须 要 放 到 寄存 器 中 。 图 12. 20 是 对 图 12. 19 的 数据 通路 进行 改 
进 后 的 流水 线 数 据 通路 ,在 流水 线 的 各 个 流水 段 之 间 加 入 了 被 称 为 流水 线 寄存 器 (流水 线 锁 
存 器 ) 的 寄存 器 堆 , 并 在 这 些 寄存 器 堆 上 标明 所 连接 的 流水 段 。 

所 有 用 于 在 同一 条 指令 的 各 个 时 钟 周期 之 间 保 存 临 时 数据 的 寄存 器 ,都 归 入 流水 线 寄 
存 器 这 一 类 中 。 流 水 线 寄存 器 由 它们 相连 的 流水 段 的 名 称 来 标记 。 例 如 ,IF/ID 流水 线 寄 
存 器 就 是 连接 IF 流水 段 和 ID 流水 段 的 .指令 寄存 器 IR 是 F/ID 流水 线 寄存 器 的 一 个 字 
段 , 记 作 IF/ID. IR。 

这 些 流 水 线 寄存 器 保存 着 从 一 个 流水 段 传 送 到 下 一 个 流水 段 的 所 有 数据 和 控制 信息 。 
随 着 流水 过 程 的 进行 ,这 些 数据 和 控制 信息 从 一 个 流水 线 寄存 器 复制 到 下 一 个 流水 线 寄 存 
器 ,直到 不 再 需要 为 止 。 如 果 在 流水 过 程 中 仅仅 使 用 先前 非 流 水 线 数据 通路 中 的 临时 寄存 
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图 12.20 DLX 流水 线 的 数据 通路 


器 ,那么 当 这 些 寄存 器 保存 的 临时 值 还 在 为 流水 线 中 某 条 指令 所 用 时 ,就 可 能 会 被 流水 线 中 
的 其 他 指令 所 重 写 。 

值得 注意 的 是 ,图 12. 17 中 的 PC 值 多 路 选择 器 在 图 12. 20 中 已 经 被 移 到 IF 段 ,这 样 
做 的 目的 是 保证 对 PC 值 的 写 操作 只 出 现在 一 个 流水 段 内 ,和 否则 当 分 支 转移 成 功 的 时 候 , 流 
水 线 中 两 条 指令 都 试图 在 不 同 的 流水 段 修 改 PC 值 , 从 而 发 生 写 冲 突 。 

每 个 时 刻 , 每 条 指令 都 只 在 一 个 流水 段 上 是 活动 的 ,因此 ,任何 指令 所 作 的 任何 动作 都 
发 生 在 一 对 流水 线 寄存 器 之 间 。 所 以 ,我 们 就 可 以 根据 指令 的 类 型 检查 ,在任 一 个 流水 段 都 
要 做 些 什 么 来 看 出 流水 线 的 动作 。 表 12.5 给 出 了 DLX 流水 线 的 每 个 流水 段 的 操作 。 

表 12.5 DLX 流水 线 的 每 个 流水 段 的 操作 

流水 段 任意 指令 


IF/ID. IR<-Mem[ PC]; 
IF/ID. NPC,PC<-(if EX/MEM. cond {EX/MEM. ALUOutput} else {PC+4})) 








ID/EX. A<-Regs[ IF/ID. IRs.w |];ID/EX. B<-Regs[IFVID.IR as]; 
ID ID/EX. NPC<-IF/ID. NPC;ID/EX. IR<IF/ID. IR; 
ID/EX. Imm<—(IF/ID. IRis )* # #1F/ID. IRis.a; 





ALU 指令 Load/Store 指令 分 支 指令 


EX/MEM. IR<-ID/EX. IR; EX/MEM. ALUOutput—— 
MEM. IR<—1l .IR; 
EX/MEM. ALUOutput<— ER EE ID/EX. NPC+ID/EX. Imm; 








/MEM. <- 
EX | ID/EX A op ID/EX mm 和 A et EX/MEM. cond<_ID/EX. A 
EX/MEM. cond<—0; ~- op 0; 
MEM/WB. IR— 
MEM/WB. IR*- EX/ MEM. IR; MEM/WB. LMD-*— 
MEM | EX/MEM. IR; Mem[EX/ MEM. ALUOutput]; 


MEM/WB. ALUOutpute | 或 
EX/MEM. ALUOutput; | Mem[ EX/MEM. ALUOutput] 一 
MEM/WB. LMD 
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续 表 


流水 段 任意 指令 
Regs[MEM/ WB. IRis.» ]—— 
MEM/WB. ALUOutput; 
WwB 或 
Regs[ MEM/ WB. IRu.1s 1— 





Regs[MEM/ WB. IR1.1s ]— 
MEM/WB. LMD:; 


MEM/WB. ALUOutput; 





为 了 控制 这 个 简单 的 DLX 基本 流水 线 ,我 们 还 需要 确定 如 何 控制 图 12. 20 中 数据 路 径 
的 4 个 多 路 开关 。ALU 输入 端的 两 个 多 路 开关 根据 指令 类 型 来 设置 , 它 由 ID/EX 寄存 器 
的 IR 给 出 。 其 中 ,上 面 的 ALU 输入 多 路 开关 根据 指令 是 否 是 分 支 指令 来 确定 ,下 面 的 多 
路 开关 根据 指令 是 寄存 器 一 寄存 器 ALU 指令 还 是 其 他 类 型 的 指令 来 确定 。IF 段 的 多 路 开 
关 选 择 增加 以 后 的 PC 值 或 者 EX/ MEM. NPC 的 值 (分 支 的 目标 地 址 ) 作 为 下 一 条 指令 的 
地 址 ,这 个 多 路 开关 由 EX/ MEM. cond 来 控制 。 第 4 个 多 路 开关 由 WB 段 的 指令 是 Load 
指令 还 是 ALU 指令 来 进行 控制 。 


12.4 流水 线 中 的 相关 问题 


在 流水 线 中 经 常 有 一 些 被 称 为 “相关 ”的 情况 发 生 , 它 使 得 指令 序列 中 下 一 条 指令 无 法 
在 设计 的 时 钟 周期 执行 ,这 些 “ 相 关 " 会 降低 流水 线 可 以 获得 的 理想 性 能 。 一 般 来 说 ,流水 线 
中 的 相关 可 以 分 为 以 下 3 种 类 型 。 

第 一 种 是 结构 相关 , 它 是 指令 在 重生 执行 的 过 程 中 ,硬件 资源 满足 不 了 指令 重生 执行 的 
要 求 ,发 生硬 件 资源 冲突 而 产生 的 相关 。 

第 二 种 是 数据 相关 , 它 是 指 在 同时 重生 执行 的 几 条 指令 中 ,一 条 指令 依赖 于 前 面 指令 的 
执行 结果 的 数据 ,但 是 目前 尚 不 能 得 到 这 个 数据 时 发 生 的 相关 。 

第 三 种 是 控制 相关 , 它 是 指 流水 线 中 分 支 指令 或 者 其 他 需要 改写 PC 的 指令 造成 的 
相关 。 

流水 线 相关 问题 是 流水 线 执行 过 程 中 的 主要 障碍 ,会 给 流水 线 中 指令 序列 的 顺利 执行 
带 来 许多 不 利 的 影响 。 如 果 不 能 较 好 地 处 理 流水 线 相关 问题 ,就 可 能 影响 流水 线 的 性 能 , 甚 
至 使 程序 运行 产生 错误 的 结果 。 要 消除 相关 带 来 的 问题 ,就 要 求 正 常 处 理 流 水 线 中 的 部 分 
指令 ,而 延迟 另 一 部 分 指令 的 执行 ,也 就 是 暂停 一 些 指令 的 执行 过 程 。 


12.4.1 结构 相关 


处 理 器 进行 流水 时 ,如 果 希 望 在 流水 线 中 顺利 执行 指令 的 所 有 组 合 , 势 必要 求 流水 线 的 
功能 部 件 能 够 充分 流水 ,或 者 资源 重复 设置 。 因 为 资源 冲突 而 无 法 使 用 某 种 指令 的 组 合 ,就 
称 该 处 理 器 的 流水 线 产生 了 结构 相关 。 最 常见 的 结构 相关 出 现在 部 分 功能 部 件 不 能 充分 流 
水 的 时 候 , 即 使 用 此 部 件 的 多 条 指令 不 能 按照 每 个 时 钟 周期 前 进 一 拍 的 速率 流水 。 另 外 一 
种 常见 的 结构 相关 是 因为 部 分 资源 没有 充分 重复 设置 .导致 流水 线 中 若干 指令 不 能 同时 
执行 。 

很 多 流水 线 机 器 的 指令 和 数据 都 共享 一 个 存储 器 ,如 果 在 某 个 时 钟 周期 内 ,流水 线 既 要 
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完成 某 条 指令 到 存储 器 读 取 数 据 的 操作 ,又 要 完成 另 一 条 指令 到 存储 器 的 读 取 指令 的 操作 ， 
这 样 就 会 发 生存 储 器 访问 冲突 问题 , 即 产生 结构 相关 。 如 图 12. 21 所 示 就 是 这 种 情况 。 
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图 12.21 存储 器 访问 冲突 造成 的 结构 相关 


为 了 消除 这 种 冲突 ,当前 一 条 指令 需要 访问 数据 存储 器 时 ,就 暂停 另 一 条 指令 的 取 指 操 
作 , 也 就 是 把 流水 线 和 暂停 一 个 时 钟 周期 ,这 个 时 钟 周期 叫 作 流水 线 的 一 个 暂停 周期 ,或 者 称 
为 "流水线 气泡 ”简称 气泡 ) 。 图 12. 22 表示 加 入 一 个 暂停 周期 后 的 数据 通路 。 
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图 12.22 插入 流水 线 气泡 消除 流水 线 结构 相关 


可 以 使 用 图 12. 23 所 示 的 时 空 图 来 表示 插入 暂停 的 流水 线 。 图 中 用 Stall 标记 暂停 周 
期 ,并 将 指令 ;十 3 的 取 指 令 操作 右 移 一 个 时 钟 周期 ,因此 ,要 到 第 9 个 时 钟 周期 流水 线 才能 
完成 指令 ;十 3 ,而 在 第 8 个 时 钟 周期 没有 任何 指令 流出 。 

为 了 消除 结构 相关 引入 了 和 暂停 周期 .这 必然 要 降低 流水 线 的 性 能 。 因 此 ,可 以 考虑 采用 
资源 充分 重复 设置 的 方法 来 避免 结构 相关 。 一 种 常用 的 方法 就 是 在 流水 线 机 器 中 设置 互相 
独立 的 指令 存储 器 和 数据 存储 器 ,具体 而 言 就 是 将 Cache 分 为 指令 Cache 和 数据 Cache。 
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指 令 
1 2 3 4 5 6 7 8 9 10 

指令 i IF D EX MEM WB 
指令 i 十 1 到 ID EX MEM WB 
指令 i 十 2 IF ID EX MEM WB 
指令 i 十 3 Stall 正 ID EX MEM WB 
指令 i 十 4 亚 ID EX MEM WB 
指令 i 十 5 IF ID EX MEM 
指令 i 十 6 IF ID EX 














图 12.23 引入 暂停 的 流水 线 时 空 图 


在 其 他 因素 对 流水 线 的 性 能 影响 都 相同 的 情况 下 ,没有 结构 相关 的 流水 线 机 器 的 
CPI 较 小 ,为 什么 设计 时 还 允许 存在 结构 相关 呢 ? 主 要 原因 有 两 个 ,降低 成 本 和 减少 功能 
部 件 的 延迟 。 为 了 避免 结构 相关 ,确保 流水 线 的 各 种 功能 部 件 完全 流水 化 ,或 者 重复 设 
置 足够 的 硬件 资源 ,都 会 导致 成 本 过 高 。 例 如 ,要 求 在 流水 线 机 器 中 ,每 个 时 钟 周期 内 都 
能 同时 进行 取 指令 操作 和 访问 数据 的 存储 器 操作 ,而 又 不 发 生 结构 相关 ,存储 总 线 的 带 
宽 就 要 加 倍 。 类 似 的 是 ,完整 流水 的 浮 点 乘法 器 需要 很 多 逻辑 门 。 为 了 消除 很 少 出 现 的 
结构 相关 而 增加 更 多 的 硬件 ,成 本 就 显得 太 高 了 。 另 外 ,完全 可 以 设计 出 比 完 全 流水 化 
功能 部 件 具 有 更 短 延 迟 时 间 的 非 流水 和 不 完全 流水 化 的 功能 部 件 , 较 短 的 延迟 是 因为 不 
需要 流水 线 寄 存 器 。 


12.4.2 数据 相关 


指令 完全 串 行 执行 ,不 会 产生 数据 相关 问题 ,而 在 指令 流水 线 技 术 中 ,同时 处 在 流水 线 
中 的 后 续 指令 用 到 其 前 面 指令 的 运算 结果 ,而 前 面 指令 的 运算 结果 尚未 产生 或 者 尚未 送 到 
指令 位 置 时 ,就 会 导致 数据 相关 。 从 如 图 12.24 所 示 的 例子 中 指令 在 流水 线 中 的 执行 情况 
的 分 析 , 可 以 清楚 地 看 到 这 种 数据 相关 的 情况 。 

在 图 12. 24 中 ,ADD 指令 后 的 所 有 指令 都 用 到 了 ADD 指令 的 计算 结果 。ADD 指令 在 
WB 段 才 能 将 计算 结果 写 人 寄存 器 R1, 但 是 SUB 指令 在 ID 段 就 要 读 取 Rl 中 的 值 ,这 种 情 
况 下 就 产生 了 数据 相关 。 除 非 采 取 预 防 措施 ,否则 SUB 指令 读 出 的 将 是 错误 的 数据 ,并 且 
导致 错误 的 计算 结果 。AND 指令 也 受 这 种 数据 相关 的 影响 ,从 图 12. 24 可 以 看 出 ,直到 时 
钟 周期 5 写 R1 才能 完成 ,AND 指令 在 时 钟 周 期 4 取出 的 Rl 的 值 也 是 错误 的 。XOR 指令 
得 到 了 正确 执行 ,因为 这 条 指令 在 时 钟 周期 6 读 取 寄 存 器 R1, 而 此 时 Rl 已 经 被 正确 地 写 
入 ,该 指令 可 以 顺利 执行 。 其实 OR 指令 也 可 以 得 到 了 正确 执行 ,这 只 需要 使 用 一 个 已 经 在 
流水 线 图 表 中 画 出 的 简单 技巧 即 可 ,就 是 在 前 半 个 周期 写 寄 存 器 堆 , 后 半 个 周期 读 寄存 器 
堆 。 这 种 技巧 通过 在 前 面 图 中 在 寄存 器 周围 画 的 虚线 框 来 表示 。 

为 了 保证 上 面 给 出 的 指令 序列 的 正确 执行 ,流水 线 只 好 暂停 ADD 指令 之 后 的 所 有 指 
令 , 直 到 ADD 指令 将 计算 结果 写 人 寄存 器 Rl 之 后 ,再 启动 ADD 指令 之 后 的 指令 继续 执 
行 。 那 么 有 没有 其 他 方法 解决 SUB 指令 和 AND 指令 的 数据 相关 呢 ? 下面 要 介绍 的 定向 
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图 12.24 流水 线 数据 相关 示例 


技术 就 可 以 减少 数据 相关 带 来 的 流水 线 和 暂停。 

1. 减少 数据 相关 带 来 暂停 的 定向 技术 

图 12. 24 中 的 问题 可 以 通过 一 种 简单 的 技术 来 解决 ,这 种 技术 被 称 为 定向 技术 (也 称 为 
劳 路 技术 )。 定 向 技术 的 主要 思想 是 ; 在 某 条 指令 产生 一 个 计算 结果 之 前 ,其 他 指令 并 不 会 
真正 需要 使 用 这 个 计算 结果 ,如 果 能 够 从 这 个 计算 结果 产生 的 地 方 直接 将 它 送 到 后 续 其 他 
指令 需要 使 用 它 的 地 方 , 那 么 就 可 以 避免 暂停 。 对 前 面 的 例子 而 言 ,'SUB 指令 是 在 ADD 指 
令 产生 了 计算 结果 之 后 , 才 真正 使 用 这 个 结果 的 。 如 果 把 ADD 指令 的 计算 结果 从 EX/ 
MEM 寄存 器 之 间 送 到 SUB 指令 需要 的 地 方 , 即 ALU 的 输入 锁 存 器 ,那么 就 可 以 不 用 引入 
暂停 了 。 

定向 技术 的 工作 流程 可 以 归纳 如 下 。 

(1) 从 EX/ MEM 寄存 器 送 入 ALU 的 结果 总 是 反馈 到 ALU 的 输入 锁 存 器 。 

(2) 当 定 向 硬件 检测 到 前 一 个 ALU 运算 结果 的 写 人 寄存 器 就 是 当前 ALU 操作 的 源 
寄存 器 时 ,那么 控制 逮 辑 就 将 前 一 个 ALU 运算 结果 定向 到 ALU 的 输入 ,而 不 是 再 从 寄存 
器 堆 读 出 源 寄 存 器 内 容 。 

从 图 12. 24 中 可 以 看 出 还 需要 注意 的 是 ,需要 定向 的 运算 结果 可 能 不 止 来 自前 一 条 指 
令 的 计算 结果 ,还 可 能 是 前 面 与 其 不 相 邻 的 其 他 指令 的 计算 结果 。 图 12. 25 是 采用 了 定向 
技术 之 后 上 述 指令 序列 的 执行 情况 .从 图 中 可 以 看 到 采用 定向 技术 之 后 这 个 指令 序列 可 以 
顺利 执行 而 不 需要 和 暂停 ,图 中 的 虚线 标明 了 定向 路 径 。 

定向 技术 的 思想 可 以 一 般 化 ,就 是 把 运算 结果 直接 送 到 需要 它 的 功能 部 件 , 即 一 个 部 件 
的 输出 直接 送 到 另 一 个 部 件 的 输入 。 考 虑 到 DLX 流水 线 的 实现 ,就 需要 从 任意 一 个 流水 线 
寄存 器 到 任意 一 个 功能 部 件 输入 端的 定向 。 因 为 ALU 和 数据 存储 器 都 接收 操作 数 ,就 需 
要 从 EX/MEM 和 MEM/WB 寄存 器 到 它们 输入 端的 旁 路 。 此 外 ,DLX 在 EX 周期 使 用 了 
一 个 检测 零 的 部 件 ,所 以 还 需要 到 这 个 部 件 的 定向 。 
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图 12.25 采用 定向 技术 消除 数据 


图 12. 26 改进 了 图 12. 20 的 设计 ,图 中 的 虚线 表示 流水 线 所 增设 的 定向 路 径 。 从 中 可 
以 看 到 ,要 定向 到 ALU, 需 要 为 每 个 ALU 多 路 开关 增加 3 个 输入 端 ,以 及 到 这 3 个 输入 端 
的 相应 通路 。 这 3 条 新 通路 分 别 来 自 EX 段 末尾 的 ALU 输出 端 MEM 段 末 尾 的 ALU 输 
出 端 和 MEM 段 的 存储 器 输出 端 。 


ID/EX EX/MEM MEM/WB ， 



























































图 12.26 DLX 流水 线 增设 的 定向 路 径 


2. 必须 进行 暂停 的 数据 相关 

虽然 利用 定向 技术 可 以 消除 由 于 数据 相关 带 来 的 暂停 ,但 是 不 幸 的 是 ,并 非 所 有 的 数据 
相关 都 能 用 定向 技术 来 解决 。 请 看 图 12. 27 中 的 指令 序列 ,这 个 指令 序列 在 流水 线 中 执行 
时 所 需要 的 定向 路 径 在 图 12. 20 中 给 出 , 它 与 带 反馈 的 ALU 操作 的 情形 不 同 。LW 指令 要 
到 第 4 个 时 钟 周期 末 才 能 从 存储 器 中 读 出 数据 ,而 SUB 指令 在 第 4 个 时 钟 周期 开始 的 时 候 
就 需要 这 一 数据 。 因 此 ,不 能 用 简单 的 硬件 来 消除 Load 操作 造成 的 数据 相关 。 如 图 12. 27 
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所 示 , 这 种 定向 需要 有 一 个 在 时 间 上 反 向 流动 的 定向 路 径 ,这 是 计算 机 设计 人 员 无 法 实 
现 的 。 
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图 12.27 LW 指令 不 能 将 结果 定向 到 SUB 指令 


为 了 保证 流水 线 能 够 正确 执行 上 述 的 指令 序列 ,需要 加 入 一 种 称 为 "流水 线 互 锁 ” 
(Pipeline Interlock) 的 新 的 功能 部 件 。 通 常 ,流水 线 互 锁 检 测 到 上 述 的 数据 相关 后 就 暂停 
流水 线 , 直 到 能 够 通过 定向 技术 解决 数据 相关 为 止 。 图 12. 28 表示 的 是 引入 了 和 暂停 和 合理 
的 定向 的 流水 线 , 由 于 暂停 SUB 以 后 的 指令 都 后 移 了 一 个 时 钟 周 期 ,到 AND 指令 就 变 成 
了 通过 寄存 器 堆 来 定向 ,而 OR 指令 根本 就 不 需要 旁 路 了 。 
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图 12.28 插入 暂停 后 的 流水 线 数 据 通路 


暂停 引入 的 流水 气泡 需要 多 用 一 个 时 钟 周期 来 完成 这 个 指令 序列 。 在 时 钟 周期 4 没有 
启动 新 的 指令 ,在 时 钟 周期 6 也 没有 流出 任何 执行 完毕 的 指令 。 图 12. 29 给 出 了 加 入 暂停 
前 后 的 流水 线 时 空 图 。 
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时 钟 
指 令 
1 2 3 4 5 6 和. 8 
LW R1.0CR2) IF ID EX MEM WB 
SUB R4.,R1,R5 I ID EX MEM WB 
ADD R6,R1,R7 下 ID EX MEM WB 
OR R8 ,R1,R9 IF ID EX MEM WB 
(a) 加 入 暂停 之 前 
时 钟 
指 令 
1 2 3 4 5 6 9 8 9 
LW R1,0CR2) IF ID EX MEM WB 
SUB R4,R1,R5 IF ID Stall EX MEM WB 





ADD R6,R1,R7 


IF Stall ID 





OR R8 ,R1,R9 








Stall IF ID EX MEM WB 








3. 编译 器 调度 方法 处 理 数据 相关 


(b) 加 入 暂停 之 后 
图 12. 29 加 入 暂停 前 后 流水 线 时 空 图 


流水 线 不 仅 会 遇 到 多 种 类 型 的 暂停 ,而 且 在 流水 线 中 有 很 多 种 暂停 会 频繁 出 现 。 例 如 
对 于 最 常见 的 A 三 B 十 C 这 样 的 操作 形式 ,采用 比较 典型 的 代码 生成 方法 可 以 得 到 图 12. 30 
中 的 指令 序列 ,这 个 指令 序列 的 流水 线 时 空 图 如 图 12. 30 所 示 , 从 中 可 以 看 出 ,在 ADD 指 
令 的 流水 过 程 中 必须 插入 一 个 暂停 时 钟 周期 ,以 保证 变量 C 的 读 入 值 有 效 ;而 SW 指令 不 
需要 另外 的 暂停 ,因为 加 法 的 结果 可 以 直接 定向 到 数据 存储 器 供 SW 指令 使 用 。 





























时 钟 
指 令 
1 2 3 4 5 6 7 8 9 
LW R1.B IF ID EX MEM WB 
LW R2.C FE ID EX MEM WB 
ADD R3.R1.R2 IF ID Stall EX MEM WB 
SW A,R3 IF Stall ID EX MEM WB 








图 12.30 A=B 十 C 的 典型 DLX 指令 序列 流水 线 时 空 图 


对 于 定向 技术 无 法 消除 的 数据 相关 问题 还 是 有 其 他 方法 能 够 进行 处 理 的 ,通过 编译 器 
对 指令 的 调度 , 即 重 新 排列 指令 序列 的 顺序 就 可 以 达到 这 个 目的 。 这 种 重新 组 织 代码 顺序 
的 技术 一 般 被 称 为 "流水 线 调度 "或 者 "指令 调度 ”。 
下 面 我 们 举 一 个 例子 来 说 明 一 些 编译 器 是 如 何 通 过 指令 调度 来 消除 流水 线 和 暂停 的 。 有 


下 面 连续 的 两 个 操作 : 


Qa 一 0 十 c 
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d=e—f 
典型 的 DLX 实现 上 述 操作 的 代码 如 下 。 


Fb,b 
Bae 
Fa,Fb,Rc 
aPa 


笛 甸 号 时 生肖 号 号 
8 
由 


进行 指令 调度 之 后 的 代码 如 下 。 


Eb,b 

Rec 

Fe,e; 交换 指令 ,消除 app 指令 暂停 
Ra,Fb,Rc 

RE,fE 

avFa ;Store/Icad 交 换 , 消 除 SB 指令 暂停 
Ra,Re,RE 

drd 


对 比 指令 调度 前 后 的 指令 序列 可 以 看 出 ,调度 前 两 条 ALU 指令 (ADD Ra,Rb,Rc 和 
SUB Rd,Re.Rf) 分 别 和 两 条 Load 指令 (LW Re,c 和 LW Rf.f) 之 间 存 在 数据 相关 。 要 保证 
流水 线 能 正确 执行 调度 前 的 指令 序列 ,必须 在 指令 执行 过 程 中 插入 两 个 时 钟 周期 的 暂停 , 调 
度 后 的 指令 序列 中 消除 了 这 样 的 暂停 。 在 此 基础 之 上 ,可 以 通过 流水 线 定 向 技术 消除 ALU 
指令 和 Store 指令 之 间 的 数据 相关 。 

现代 的 许多 编译 器 都 试图 通过 指令 调度 来 改善 流水 线 的 性 能 。 在 最 简单 的 算法 中 , 编 
译 器 只 能 调度 程序 基本 块 中 的 指令 。 所 谓 程序 基本 块 是 指 一 个 线性 代码 串 , 除 了 开始 和 结 
尾 之 外 , 它 没有 其 他 的 入 口 和 出 口 。 调 度 这 样 的 代码 串 比 较 容易 ,因为 基本 块 中 的 每 条 指令 
都 是 顺序 执行 的 ,很 容易 生成 一 个 指令 之 间 的 相关 图 ,并 重新 排列 指令 顺序 使 暂停 最 小 。 

4. 数据 相关 的 动态 调度 

在 本 章 第 3 节 和 第 4 节 中 介绍 的 DLX 基本 流水 线 中 ,我 们 认为 流水 线 负责 取 指 令 并 发 
射 它 ,除非 已 经 在 流水 线 中 的 指令 与 这 个 取 到 的 指令 之 间 存 在 数据 相关 ,而 且 不 能 通过 定向 
技术 予以 避免 。 定 向 技术 降低 了 流水 线 的 实际 延迟 ,从 而 使 某 些 数据 相关 不 会 导致 冲突 。 
如 果 有 实在 不 可 避免 的 数据 相关 ,那么 检测 冲突 的 硬件 将 停止 相关 的 指令 及 其 后 面 的 指令 
进入 流水 线 , 直 至 相关 关系 清除 才 会 再 取出 和 发 射 新 的 指令 。 为 了 分 离 出 有 相关 的 指令 , 减 
少 实际 冲突 及 相应 暂停 的 数目 ,就 需要 使 用 前 面 介绍 由 编译 器 来 完成 的 静态 调度 。 

早期 的 几 种 处 理 器 还 使 用 了 另外 一 种 方法 , 即 动态 调度 法 。 这 种 方法 是 由 硬件 动态 调 
整 指令 执行 顺序 以 减少 暂停 的 影响 。 动 态 调度 法 不 仅 能 够 处 理 某 些 在 编译 阶段 无 法 知道 的 
相关 关系 (如 涉及 内 存 引 用 时 ) ,而 且 能 够 简化 编译 器 设计 ,最 重要 的 是 它 能 够 允许 在 别 的 流 
水 线 机 器 上 编译 的 指令 ,在 不 同 的 流水 线 上 也 能 有 效 地 和 运行。 这些 优点 是 以 硬件 复杂 度 显 
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流水 线 巩 术 


著 增 加 为 代价 的 。 

尽管 动态 调度 并 不 能 真正 消除 数据 相关 .但 它 能 在 出 现 数据 相关 时 尽量 避免 出 现 处 
理 器 暂停 。 相 比 之 下 ,静态 流水 线 调度 方法 则 是 尽量 通过 分 离 有 相关 问题 的 指令 使 它们 
不 会 导致 冲突 ,从 而 减少 暂停 的 影响 。 下 面 我 们 就 来 简单 地 分 析 一 下 动态 调度 的 基本 
思想 。 

到 目前 为 止 所 讨论 的 流水 线 技术 的 一 个 主要 限制 ,就 是 它们 全 都 使 用 按 序 发 射 指令 
机 制 , 即 如 果 指 令 在 流水 线 中 被 暂停 ,那么 后 继 指令 也 无 法 前 行 。 因 此 , 若 两 条 相 邻 的 指 
令 存 在 相关 关系 ,就 会 导致 流水 线 暂停 。 对 于 有 多 个 功能 部 件 的 机 器 ,就 会 造成 这 些 功 
能 部 件 的 闲置 。 如 果 指 令 j 相关 于 正在 流水 线 中 执行 的 指令 i, 而 i 的 运行 时 间 又 很 长 ， 
那么 所 有 j 后面 的 指令 也 必须 停 下 来 直至 i 执行 完成 ,j 才能 开始 执行 。 例 如 下 面 的 指令 
序列 ， 

DIVD FO,F2,F4 

RDD ~ Fl0,F0,F8 

SUBD ~ Fl2,F8,F14 


ADDD 相关 于 DIVD 指令 导致 流水 线 暂 停 ,所 以 ADDD 不 能 执行 。 然 而 SUBD 指令 与 
流水 线 中 的 所 有 指令 都 不 相关 , 它 仍然 不 能 执行 ,这 就 是 由 于 指令 顺序 流出 而 带 来 的 局 
限 性 。 

在 本 章 第 3 和 第 4 节 讨论 的 DLX 流水 线 中 ,结构 相关 和 数据 相关 都 是 在 指令 译 码 (ID) 
阶段 进行 检测 的 ,如 果 一 条 指令 可 以 正确 执行 才 会 从 ID 发 射出 去 。 如 果 要 使 上 例 中 的 
SUBD 指令 开始 执行 ,就 必须 把 发 射 阶段 分 为 两 个 阶段 : 检测 结构 相关 和 检测 数据 相关 。 
在 发 射 指令 时 仍然 能 够 进行 结构 相关 检测 ,依旧 是 使 用 按 序 发 射 指令 的 方法 。 但 是 只 要 指 
令 的 操作 数 就 绪 就 执行 . 即 指令 可 以 乱 序 执行 ,而 且 指 令 的 结束 也 是 乱 序 的 。 

乱 序 执行 最 主要 的 困难 是 在 异常 处 理 上 。 在 采用 动态 调度 方法 的 处 理 机 中 ,在 某 条 指 
令 产 生 异 常情 况 时 ,有 可 能 出 现 其 后 面 的 指令 已 经 执行 完成 的 情况 ,这 样 异常 处 理 是 不 精确 
的 。 这 种 异常 出 现 之 后 是 难以 确定 和 恢复 现场 的 。 精 确 的 异常 处 理 需 要 使 用 推断 的 方法 来 
解决 ,后 面 我 们 将 会 对 推断 的 方法 进行 简单 介绍 。 

为 了 允许 乱 序 执行 .将 DLX 基本 流水 线 的 译 码 阶段 再 分 为 两 个 阶段 ,第 一 个 阶段 是 发 
射 阶 段 ,完成 指令 译 码 . 并 检测 结构 相关 情况 ;第 二 个 阶段 是 读 操作 数 阶段 ,等 待 直到 不 存在 
数据 相关 ,并 读 出 操作 数 。 在 动态 调度 的 流水 线 中 ,所 有 指令 在 发 射 阶段 都 是 按 序 发 射 的 ， 
但 读 操 作 数 阶段 有 可 能 会 被 暂停 或 者 绕 过 和 暂停 指令 .从 而 可 以 乱 序 执行 。 


12.4.3 控制 相关 


在 DLX 流水 线 中 ,控制 相关 对 流水 线 带 来 的 影响 比 数据 相关 更 大 。 当 执行 一 条 分 支 指 
令 的 时 候 , 它 是 否 适用 程序 计数 器 PC 的 值 加 4 是 不 确定 的 ,因为 这 条 分 支 指令 还 可 能 把 
PC 改 为 分 支 转移 成 功 以 后 的 目标 地 址 。 只 有 当 分 支 转移 不 会 执行 的 时 候 , 原 PC 的 值 才 会 
有 用 。 如 图 12. 20 所 示 . 如 果 分 支 指令 i 分支 成 功 转移 ,那么 通常 要 到 MEM 段 的 末尾 ,在 
已 经 完成 了 地 址 计算 和 比较 之 后 才能 改变 PC。 

处 理 分 支 指令 最 简单 的 方法 就 是 一 旦 发 现 分 支 指令 就 暂停 流水 线 , 即 暂停 该 指令 之 后 
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的 所 有 指令 ,直到 分 支 指令 达到 MEM 段 确定 了 新 的 PC 值 为 止 。 当 然 , 我 们 在 发 现 它 是 分 
支 指令 之 前 是 不 愿意 暂停 流水 线 的 ,因此 暂停 在 ID 段 之 后 才 会 发 生 ,图 12. 31 所 示 的 流水 
线 时空 图 就 描述 了 这 种 处 理 方法 。 从 图 中 可 以 看 出 ,在 流水 线 中 引入 了 两 个 暂停 周期 。 控 
制 相关 的 处 理 方法 和 数据 相关 不 同 , 它 要 根据 新 的 有 效 PC 值 进 行 取 指令 操作 。 这 样 分 支 
指令 上 就 给 流水 线 带 来 了 3 个 时 钟 周期 的 暂停 。 









































本 时 钟 
1 2 3 4 5 6 7 8 9 10 
分 支 指令 ww D EX MEM WB 
分 支 后 继 指 令 IF Stall Stal IF ID EX MEM WB 
分 支 后 继 指令 十 1 IF ID EX MEM WB 
分 支 后 继 指令 十 2 IF ID EX MEM 
分 支 后 继 指令 十 3 下 ID EX 
分 支 后 继 指令 十 4 I DD 
分 支 后 继 指令 十 5 正 
图 12. 31 简单 方法 处 理 分 支 指令 的 流水 线 时 空 加 
如 果 流 水 线 中 处 理 每 条 分 支 指令 都 要 引入 3 个 时 钟 周期 的 暂停 ,那么 这 必然 要 严重 降 


低 流 水 线 的 性 能 ,是 对 资源 一 种 巨大 的 浪费 。 如 果 流 水 线 理想 的 CPI 是 1, 目 标 代码 中 分 支 
指令 占 30% ,那么 分 支 暂停 将 使 机 器 大 约 只 能 达到 流水 线 理 想 加 速 比 的 一 半 , 所 以 减少 分 
支 的 开销 就 变 得 十 分 重要 。 通 常 , 可 以 分 如 下 的 两 个 步 又 来 减少 流水 线 处 理 分 支 指令 时 的 
暂停 周期 数 。 

(1) 在 流水 线 中 尽早 判断 出 分 支 转移 是 否 真正 发 生 。 

(2) 尽早 计算 出 分 支 成 功 转移 时 的 PC 值 (如 分 支 的 目标 地 址 ) 。 

要 对 分 支 指令 进行 优化 处 理 , 就 必须 解决 好 上 面 这 两 个 问题 ,如 果 只 是 计算 分 支 的 目标 
地 址 , 却 不 知 下 一 条 指令 到 底 是 由 分 支 目 标 地 址 指出 的 指令 ,还 是 由 PC 十 4 确定 的 指令 , 那 
么 优化 就 没有 实际 意义 。 

在 DLX 流水 线 中 ,分支 指令 BEQZ 和 BENZ 需要 测试 分 支 条 件 寄存 器 的 值 是 否 为 0， 
可 以 考虑 把 测试 分 支 条 件 寄存 器 的 操作 移 到 ID 段 完成 ,这 样 在 ID 周期 末尾 就 能 够 完成 分 
支 转 移 是 否 成 功 的 检测 。 实 现 这 种 优化 的 前 提 还 要 尽早 计算 出 分 支 转移 成 功 和 分 支 转移 失 
败 时 的 两 个 PC 值 。 为 此 ,就 需要 在 ID 段 增加 一 个 加 法 器 ,以 避免 结构 相关 。 图 12. 32 是 
对 DLX 流水 线 进行 上 述 修改 后 的 数据 通路 ,从 中 不 难看 出 ,改进 后 的 数据 通路 处 理 分 支 指 
令 只 需要 一 个 时 钟 周期 的 暂停 。 

在 某 些 流水 线 机 器 中 ,由 于 检测 分 支 条 件 和 计算 分 支 转移 目标 地 址 需要 更 长 的 时 间 , 所 
以 处 理 分 支 指令 时 比 上 面 所 举 的 例子 要 使 用 更 多 的 时 钟 周期 。 一 般 而 言 ,流水线 级 数 越 多 ， 
处 理 分 支 指令 带 来 的 控制 相关 所 需要 的 时 钟 周期 就 越 多 。 

减少 流水 线 分 支 开销 的 方法 有 很 多 种 。 前 面 已 经 简单 讨论 了 从 硬件 方面 减少 流水 线 暂 
停 周 期 的 方法 。 下 面 我 们 将 主要 从 编译 技术 的 角度 ,分 析 几 种 减少 流水 线 分 支 开销 的 简单 
方法 。 这 几 种 方法 都 有 一 个 共同 的 特点 , 即 这 些 方法 对 分 支 转移 是 否 成 功 进行 的 预测 都 是 
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图 12.32 对 图 12. 20 进行 修改 后 的 DLX 流水 线 的 数据 通路 


静态 的 ,而 且 在 整个 程序 的 执行 过 程 中 保持 这 种 预测 结论 : 要 么 总 是 认为 分 支 转移 成 功 ,要 
么 总 是 认为 分 支 转移 失败 。 在 下 一 节 我 们 将 讨论 更 高 效 的 编译 器 调度 方法 ,例如 循环 展开 
能 够 减少 循环 分 支 的 频 度 ,此 外 ,在 下 一 节 还 会 涉及 一 些 基 于 硬件 的 动态 预测 调度 方法 。 

1. 冻结 或 者 排 空 流 水 线 的 方法 

处 理 分 支 最 简单 的 方法 就 是 冻结 或 者 排 空 流水 线 , 也 就 是 保持 或 者 清除 流水 线 在 分 支 
指令 之 后 读 人 的 所 有 指令 ,直到 知道 分 支 指令 的 目标 地 址 以 及 分 支 转移 是 否 成 功 为 止 。 这 
种 方法 的 优点 是 软件 和 硬件 都 很 简单 。 图 12. 31 所 示 的 就 是 这 种 简单 的 处 理 方法 ,主要 应 
用 在 早期 的 流水 线 中 。 

2. 预测 分 支 转移 失败 的 方法 

DLX 流水 线 采用 预测 分 支 转移 失败 的 方法 ,这 种 方法 是 指 当 流 水 线 译 码 到 一 条 分 支 指 
令 时 ,就 像 分 支 指令 就 是 一 条 普通 的 指令 那样 ,流水 线 继续 取 后 续 的 指令 ,并 且 人 允许 分 支 指 
令 后 续 指令 在 流水 线 中 正常 流动 。 当 流水 线 确定 分 支 转移 是 否 成 功 以 及 分 支 的 目标 地 址 之 
后 ,如 果 分 支 转移 成 功 .流水 线 就 将 分 支 指令 之 后 取出 的 所 有 指令 用 空 操作 来 代替 ,同时 从 
分 支 指令 目标 地 址 处 取 来 有 效 指令 继续 执行 ;如 果 分 支 转移 失败 ,那么 流水 线 仍然 可 以 正常 
流动 ,分 支 指令 就 看 作 一 条 普通 的 指令 一 样 ,也 就 不 需要 废弃 分 支 指令 之 后 取出 的 所 有 指 
令 。 图 12. 33 所 示 的 就 是 采用 这 种 方法 处 理 分 支 指令 的 流水 线 时 空 图 。 

3. 预测 分 支 转移 成 功 的 方法 

和 预测 分 支 转移 失败 相反 的 另外 一 种 方法 就 是 预测 分 支 转移 成 功 ,采用 这 种 方法 时 ,一 
且 完 成 分 支 指令 的 译 码 并 且 计算 出 了 分 支 的 目标 地 址 ,就 假设 分 支 转移 成 功 , 并 且 开始 在 分 
支 目 标 地 址 处 取 指 令 执 行 。 

4. 分 支 延 迟 的 方法 

分 支 延 迟 技术 是 一 种 软件 方法 , 它 由 编译 程序 重 排 指令 序列 来 实现 。 其 基本 思想 是 从 
人 逻辑 上 “延长 ”分 支 指令 的 执行 时 间 . 即 发 生 “ 分 支 转移 成 功 ” 时 并 不 排 空 指令 流水 线 , 而 是 让 
紧 跟 在 分 支 指令 工 之 后 已 进入 流水 线 的 少数 几 条 指令 继续 完成 ,如 果 这 些 指 令 是 与 分 支 指 
令 工 结果 无 关 的 有 用 指令 ,那么 延迟 损失 时 间 就 可 以 被 有 效 地 利用 。 
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时 钟 
指 令 
和 2 3 4 5 6 划 8 和 
分 支 指令 i 1 ID EX MEM WB 
指令 i 十 1 [i ID EX MEM WB 
指令 i 十 2 正 ID EX MEM WB 
指令 i 十 3 IF ID EX MEM WB 
指令 i 十 4 玲 ID EX MEM WB 
(a) 分 支 转移 失败 
时 钟 
指 令 
2 3 4 5 6 7 8 
分 支 指令 i IF ID EX MEM WB 
指令 i 十 1 IF Idle Idle ldle Idle 
分 支 目 标 IF ID EX MEM WB 
分 支 目 标 十 1 IF ID EX MEM WB 
分 支 目 标 十 2 IF ID EX MEM WB 
(b) 分 支 转移 成 功 
图 12. 33 采用 预测 分 支 转移 失败 方法 时 流水 线 时 空 图 
分 支 指令 
后 续 指令 | 
后 续 指令 2 
本 分 支 延 迟 模 
后 续 指令 
分 支 目标 地 址 指令 


后 续 指 令 放 在 分 支 延 迟 槽 中 ,不管 分 支 转移 是 否 成 功 ,这 些 指令 都 要 被 流水 执行 。 并 不 
是 所 有 的 指令 都 能 够 放 到 延迟 槽 中 ,选择 放 到 分 支 延迟 槽 中 的 指令 必须 按照 一 定 的 原则 经 
过 编译 器 的 调度 。 图 12. 34 画 出 了 对 分 支 延迟 的 3 种 调度 方法 , 表 12.6 则 给 出 了 这 3 种 调 
度 方法 所 受 的 限制 ,以 及 它们 各 自 的 应 用 场合 ,显然 采用 这 种 分 支 延迟 方法 可 以 减少 流水 线 


分 支 开销 。 
5. 控制 相关 的 动态 调度 


解决 控制 相关 问题 不 仅 对 于 每 个 周期 发 射 一 条 指令 的 处 理 机 能 够 起 到 有 效 的 作 


用 ,而 且 对 于 后 面 要 讲 到 的 单 周期 发 射 多 条 指令 的 处 理 机 也 是 很 可 


要 的 。 在 单 周期 发 





射 n 条 指令 的 情况 下 .分 支 操作 将 会 以 超过 倍 的 情形 出 现 , 这 更 要 求 对 分 支 情况 提前 


做 出 预测 。 


在 本 节 前 面部 分 给 出 了 处 理 分 支 的 各 种 静态 调度 方法 ,这 些 方法 不 受 分 支 动态 行为 的 
影响 。 还 讨论 了 分 支 延迟 机 制 , 它 允许 在 编译 阶段 通过 软件 手段 来 调度 和 优化 分 支 。 除 了 
软件 方法 之 外 ,还 可 以 通过 硬件 动态 地 进行 分 支 处 理 , 对 程序 运行 时 分 支 的 行为 进行 预测 ， 
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提前 对 分 支 操作 做 出 反应 ,提高 分 支 的 处 理 速度 。 下 面 对 分 支 预测 缓冲 技术 、 分 支 目标 缓 冲 
技术 和 推断 执行 技术 进行 简单 的 介绍 ,更 详细 的 资料 可 以 参考 有 关 文 献 。 














































































































ADD R1, R2, R3 SUB R4, R5, R6 一 -| ADD R1, R2, R3 
IfR2 = 0 Then 一 一 IfRI=0Then ~ 
ADD RI1, R2, R3 延迟 模 
延迟 本 IfRI=0Then 一 
SUB R4, R5, R6 
一 一 延迟 槽 | 
调度 后 | 调度 后 | 调度 后 | 
一 -1 ADD RI1, R2, R3 
IfR2 = 0 Then 一 一 IfFR1 = 0 Then 一 一 
ADD R1, R2, R3 
ADD R1, R2, R3 IfR1 =0 Then 一 一 SUB R4, R5, R6 
一 一 SUB R4, R5, R6 一 -一 
(a) 来 自分 支 前 面 (b) 来 自 目标 地 址 (c) 来 自 延迟 醒 后 


图 12.34 分 支 延 迟 的 3 种 调度 方法 


表 12.6 分 支 延 迟 的 几 种 调度 方法 以 及 它们 的 限制 











调度 策略 所 受 限 制 对 流水 线性 能 改善 的 影响 
，。 | 被 调度 指令 必须 与 分 支 指令 不 相关 , 即 | 5， ws sso 
Ca? 来 自分 支 前 面 | 第 浊 度 关 信 必须 本 分 让 折 全 不 总 是 可 以 提高 流水 线 的 性 能 
如 果 分 支 转移 失败 ,必须 保证 被 调度 的 | 分 支 转移 成 功 时 ,可 以 提高 流水 线 的 性 
(了 来 自 目标 地 址 | 指令 对 程序 的 执行 没有 影响 ,可 能 还 需 | 能 但 由 于 需要 复制 指令 ,可 能 加 大 程 
要 复制 被 调度 的 指令 序 空间 
ee 如 果 分 支 转移 成 功 ,必须 保证 被 调度 的 | 分 支 转移 失败 时 ,可 以 提高 流水 线 的 
《9 来自 延 迟 本 后 | 指令 对 程序 的 执行 没有 影响 性 能 








最 简单 的 动态 分 支 预测 方法 (Dynamic Branch Prediction) 是 使 用 分 支 预测 缓冲 区 
(Branch Prediction Buffer,BPB) 。 缓 冲 区 的 每 一 项 内 容 被 用 来 预测 分 支 转移 是 否 成 功 , 并 
且 根 据 实 际 的 分 支 情况 对 内 容 进 行 修 改 。 这 种 方法 是 基于 如 下 的 考虑 : 如 果 本 次 分 支 转移 
成 功 了 ,那么 预测 下 一 次 分 支 转移 也 成 功 。 

改进 的 动态 分 支 预测 方法 是 分 支 目 标 缓冲 区 (Branch Target Buffer,BTB) 技 术 。 具 体 
做 法 就 是 将 分 支 转移 成 功 的 分 支 指令 的 地 址 和 它 的 分 支 目标 地 址 都 放 到 一 个 缓冲 区 中 保存 
起 来 ,缓冲 区 以 分 支 指令 的 地 址 作为 标志 ;在 取 指 令 阶 段 , 所 有 的 指令 地 址 都 与 保存 的 标志 
作 比 较 , 如 果 相同 ,就 认为 本 条 指令 是 分 支 指令 ,而 且 认 为 它 分 支 转移 成 功 ,同时 它 的 分 支 目 
标 (下 一 条 指令 ) 地 址 就 是 保存 在 缓冲 区 中 的 分 支 目 标 地 址 。 

推断 执行 是 指 在 处 理 器 还 没有 判断 指令 是 否 能 够 执行 之 前 就 提前 执行 的 一 种 技术 , 采 
用 这 种 技术 可 以 有 效 地 克服 控制 相关 。 这 种 推断 执行 的 过 程 带 有 明显 的 投机 性 质 , 如 果 推 
断 准 确 , 它 可 以 消除 所 有 附加 延迟 。 因 此 在 大 多 数 推断 准确 的 情况 下 ,推断 执行 技术 可 以 有 
效 地 加 快 分 支 处 理 速度 。 基 于 硬件 方案 的 推断 执行 技术 可 以 说 是 根据 动态 的 数据 相关 性 来 
选择 指令 的 执行 时 刻 , 它 综合 了 以 下 想法 : 动态 的 分 支 预测 决定 执行 哪 条 指令 ;在 控制 相关 
消除 之 前 推断 执行 指令 ;对 程序 基本 块 采 用 指令 动态 调度 。 
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实现 推断 的 最 重要 的 思想 就 是 允许 指令 乱 序 执行 但 顺序 确认 ,只 有 确认 以 后 的 结果 才 
是 最 终 的 结果 ,从 而 避免 如 更 新 状态 或 者 发 生 异 常 等 不 可 恢复 的 行为 。 但 是 推断 技术 也 存 
在 着 一 个 主要 的 缺点 , 即 支持 推断 技术 的 硬件 太 复 杂 , 需 要 大 量 的 硬件 资源 。 


12.5 指令 级 并 行 技术 


12.5.1 基本 概念 


从 本 章 前 面 几 节 可 以 知道 , 当 指 令 不 相关 时 ,它们 在 流水 线 中 是 重 伙 执行 的 。 这 种 指令 
序列 中 存在 的 潜在 并 行 性 称 为 指令 级 并 行 。 下 面 主要 讨论 的 就 是 如 何 通 过 各 种 可 能 的 技 
术 , 获 得 更 多 的 指令 级 并 行 性 , 即 需 要 开发 指令 级 并 行 度 (Instruction Level Parallelism， 
ILP) , 它 定 义 为 在 一 个 时 钟 周期 内 流水 线 上 流出 的 指令 数 。 

衡量 指令 级 并 行 性 的 一 个 指标 是 (Clock Cycles Per Instruction,CPI) , 它 定 义 为 流水 线 
中 执行 一 条 指令 所 需 的 时 钟 周期 数 。 在 前 面 已 经 介绍 了 ,理想 的 流水 线性 能 是 每 一 个 时 钟 
周期 都 能 启动 一 条 指令 的 执行 。 假 设 流水 线 有 mm 个 流水 段 , 一 个 程序 执行 时 共 执 行 了 n 条 
指令 , 则 平均 每 条 指令 所 占用 的 时 钟 周期 数 CPI==(m 十 n 一 1)/n, 当 nn 二 宝 m 时 ,CPIAx1。 为 
了 达到 CPI=1 这 样 的 理想 情况 ,必须 采用 相应 的 技术 减少 数据 相关 和 控制 相关 ,在 上 一 节 
中 已 经 介绍 了 处 理 相 关 问 题 的 基本 方法 。 

指令 流水 处 理 机 比 传统 的 串 行 处 理 机 有 较 高 的 吞吐 率 , 其 原因 在 于 多 条 指令 可 在 流水 
线 的 不 同 功能 段 中 同时 进行 操作 , 即 实现 了 指令 级 的 并 行 性 。 但 要 进一步 提高 流水 线 的 吞 
吐 率 , 获 得 更 高 的 性 能 ,就 必须 使 CPI 一 1 ,那么 有 没有 办 法 使 CI 小 于 1 呢 ? 原来 我 们 不 能 
使 CPI 一 1 的 最 直接 原因 就 是 每 个 时 钟 周 期 只 能 流出 一 条 指令 ,如 果 流 水 线 在 一 个 时 钟 周 
期 内 能 够 有 多 条 指令 流出 的 话 ,目的 就 可 以 实现 了 ,多 指令 发 射 处 理 器 就 有 效 地 解决 了 这 个 
问题 。 多 指令 发 射 处 理 器 主要 有 4 种 , 即 超标 量 (Superscalar)、 超 流水 线 
(Superpipelining) ,超标 量 超 流 水 线 (Superscalar Superpipelining) 和 超 长 指令 字 (Very 
Long Instruction Word, VLIW). 


12.5.2 多 指令 发 射 技术 


超标 量 、 超 流水 线 和 超标 量 超 流水 线 3 种 处 理 机 在 一 个 时 钟 周期 内 可 以 执行 完成 多 条 
指令 , 即 它 们 的 ILP 之 1。 如 果 用 一 台 & 段 流水 线 的 普通 标量 流水 处 理 机 做 比较 基准 ,为 了 
便于 比较 ,把 基准 标量 处 理 机 的 机 器 流水 线 周期 和 指令 发 射 等 待 时 间 都 假定 为 1 个 时 钟 周 
期 ,同时 发 射 的 指令 条 数 为 1 条 , 即 假设 它 的 指令 级 并 行 度 ILP 为 1。 超 标量 处 理 机 的 并 行 
度 为 m, 超 流水 线 处 理 机 的 并 行 度 为 n. 超 标量 超 流水 线 处 理 机 的 并 行 度 为 (m,n) , 则 4 种 不 
同类 型 处 理 机 的 时 空 图 和 ILP 如 图 12. 35 所 示 , 其 主要 性 能 比较 如 表 12.7 所 示 。 

在 目前 的 微 处 理 机 中 ,大 多 数 属于 超标 量 处 理 机 。 例 如 .Intel 公司 的 1860、i960、 
Pentium,Motorola 公司 的 MC88110.IBM 公司 的 Power 6000.SUN 公司 的 Super SPARC 
等 都 是 超标 量 处 理 机 。SGI 公司 的 MIPSR 4000、R5000、R10000 等 都 是 超 流水 线 处 理 机 。 
DEC 公司 的 Alpha 是 超标 量 超 流 水 线 处 理 机 。 
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今 | 
指 人 | 每 个 时 钟 周期 发 对 1 条 指令 ，ILP-1 
友 I [|D [EX [MEM| WB 
5 IF ID | EX |MEM | WB 1 
三 IF ID | EX |MEM| WB | 
站 FF ID EX | MEM | WB 1 1 1 
1 2 3 4 5 6 了 8 时 名 周期 
(a) 基准 标量 处 理 机 时 空 图 
指令 | 每 个 时 钾 周 期 发 时 3 条 指令 ，ILP-3 
万 IF ID | EX |MEM | WB 
汉 IF | ID | EX |MEM| WB 
D1 IF ID | EX |MEM | WB 
is IF | ID | EX |MEM| WB 1 
鸭 IF | ID | EX |MEM| WB | 
n FF | ID | Ex |MEM| WB | 
nL IF | ID | Ex |MEM| WB 1 | 
b|_IF ID | EX | MEM| WB | | 
nL_IF ID | EX [MEM| WB ! ! a 
1 2 3 了 6 了 & 
时 钟 周期 
(b) 超标 量 处 理 机 时 空 图 
指令 | 
每 13 个 时 钟 周期 发 射 1 条 指令 ，ILP=: 
用 IF ID 
人 IF ID | EX 
刀 IF ID | EX | MEM 
1 iF [| ID | EX [ME 1 
的 IF | 1 | EX [MEM | 
ls 下 | ID T EX [MEM ! 
53 IF iD | EX | MEM 1 | 
L IF | ID | EX [MEMT WB | | 
n[m [mmD | Ex [MEMT wB | 1 1 要 
1 2 3 4 5 6 
时 钟 周 其 
l (©) 超 流水 线 处 理 机 时 空 图 
指令 | 每 个 时 名 周期 发 时 9 条 指令 ，ILP-9 
为 IF | 1w | Ex [MEM| wB 
而 IF ID | EX | MEM | WB 
区 IF ID | EX | MEM | WB 
万 IF | ID | EX [MEMT WB 
入 IF ID | EX |MEM| WB 
潜 IF ID | EX | MEM| wB 
Bl [PDTEX [MEMT WB T 
bl | wD | Ex |MEM| WB 
nL | wD | EX [MEM| WB 
1 2 3 4 5 6 T 8 
时 钟 周 
(d) 超标 量 超 流水 线 处 理 机 时 空 图 人 
图 12.35 几 种 不 同 处 理 机 的 时 空 图 和 ILP 
表 12.7 4 种 不 同类 型 处 理 机 的 性 能 比较 
普通 标量 处 理 机 | 超标 量 处 理 机 | 超 流水 线 处 理 机 | 超标 量 超 流水 线 处 理 机 
机 器 流水 线 周期 1 个 1 In 1/n 个 
同时 发 射 指令 数 1 条 mn 条 1 条 2 条 
指令 级 并 行 度 1 m n mXn 
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1. 超标 量 处 理 机 

通常 把 一 个 时 钟 周 期 内 能 够 同时 发 射 多 条 指令 的 处 理 机 称 为 超标 量 处 理 机 。 这 种 处 理 
机 的 基本 要 求 是 必须 要 有 两 套 或 者 两 套 以 上 的 完整 的 指令 执行 部 件 。 图 12. 35(b) 是 典型 
的 超标 量 处 理 机 的 指令 流水 线 时 空 图 。 为 了 能 够 在 一 个 时 钟 周期 内 同时 发 射 多 条 指令 , 超 
标量 处 理 机 必须 有 两 条 或 者 两 条 以 上 能 够 同时 工作 的 指令 流水 线 。 高 性 能 超标 量 处 理 机 一 
般 还 有 一 个 先行 指令 窗口 , 它 能 够 从 指令 Cache 中 预 取 多 条 指令 ,而 且 能 够 对 这 些 指 令 进行 
数据 相关 性 分 析 和 功能 部 件 冲突 检测 。 这 些 同时 也 能 够 说 明 超标 量 流水 线 处 理 器 的 控制 逻 
辑 是 相当 复杂 的 。 

超标 量 处 理 机 是 开发 空间 并 行 性 ,在 每 个 时 钟 周期 可 以 平均 执行 完成 多 条 指令 。 如 果 
一 台 超 标量 处 理 机 每 个 时 钟 周 期 同时 发 射 m 条 指令 , 则 它 的 指令 级 并 行 度 ILP 的 期 望 值 就 
为 m。 但 由 于 资源 冲突 、 数 据 相 关 、 控 制 相关 等 原因 ,实际 的 ILP 不 可 能 达到 mw, 通常 是 1 二 
ILP<m,。 

2. 超 流 水 线 处 理 机 

一 般 把 在 一 个 时 钟 周期 内 能 够 分 时 发 射 多 条 指令 的 处 理 机 称 为 超 流水 线 处 理 机 。 另 
外 ,也 把 指令 流水 线 的 段 数 大 于 等 于 8 的 流水 线 处 理 机 称 为 超 流水 线 处 理 机 。 超 流水 线 处 
理 机 和 超标 量 处 理 机 的 工作 方式 不 同 , 超 标量 处 理 机 是 通过 重复 设置 多 个 部 件 , 并 且 让 这 些 
部 件 能 够 同时 工作 来 提高 指令 的 执行 速度 ,实际 上 是 以 增加 硬件 资源 为 代价 换取 处 理 机 性 
能 的 ;而 超 流水 线 处 理 机 则 只 是 通过 增加 少量 硬件 ,通过 各 部 分 硬件 的 充分 重 盖 工作 来 提高 
处 理 机 的 性 能 。 

从 图 12.35(c) 可 以 看 出 ,超标 量 处 理 机 采用 的 是 空间 并 行 性 ,而 超 流 水 线 处 理 机 是 开 
发 时 间 并 行 性 ,通过 各 部 分 硬件 的 充分 重生 来 提高 机 器 性 能 。 一 台 并 行 度 ILP 为 n 的 超 流 
水 线 处 理 机 . 它 在 一 个 时 钟 周 期 内 能 够 发 射 n 条 指令 。 但 是 n 条 指令 不 是 同时 发 射 ,而 是 每 
隔 1/2 个 时 钟 周期 发 射 一 条 指令 。 

3， 超标 量 超 流 水 线 处 理 机 

从 指令 级 并 行 性 来 看 ,超标 量 处 理 机 主要 开发 空间 并 行 性 ,依靠 重复 设置 的 操作 部 件 同 
时 执行 多 个 操作 来 提高 程序 的 执行 速度 。 而 超 流 水 线 处 理 机 则 主要 开发 时 间 并 行 性 ,在 同 
一 个 操作 部 件 上 重生 多 个 操作 ,通过 使 用 较 快 时 钟 周期 的 深度 流水 线 来 加 快 程序 的 执行 
速度 。 

为 了 进一步 提高 指令 级 并 行 度 ,可 以 把 超标 量 技术 与 超 流水 线 技术 结合 在 一 起 ,这 就 是 
超标 量 超 流水 线 处 理 机 。 图 12. 35(d) 表 示 它 的 指令 执行 时 空 图 。 它 在 一 个 时 钟 周期 内 要 
发 射 指令 mm 次 ,每 次 发 射 指令 条 , 故 每 个 时 钟 周期 中 总 共 发 射 指令 mwXn 条 。 

超标 量 超 流 水 线 处 理 机 既 开发 空间 并 行 性 , 又 开发 时 间 并 行 性 。 其 并 行 度 期 望 值 为 
mXn, 

4. 超 长 指令 字 处 理 机 

超 长 指令 字 处 理 机 主要 是 基于 以 下 思路 : 由 编译 程序 在 编译 时 找 出 指令 间 潜 在 的 并 行 
性 ,进行 适当 调度 安排 ,把 多 个 能 并 行 执行 的 操作 组 合 在 一 起 ,成 为 一 条 具有 多 个 操作 有 段 的 
超 长 指令 。 由 这 条 超 长 指令 去 控制 VLIW 处 理 机 中 多 个 互相 独立 工作 的 功能 部 件 ,每 个 操 
作 段 控制 一 个 功能 部 件 ,相当 于 同时 执行 多 条 指令 。 

VLIW 处 理 机 是 一 种 单 指令 多 操作 码 多 数据 的 系统 结构 。VLIW 的 字 长 与 机 器 中 的 执 
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行 部 件数 有 关 。 一 般 来 说 ,对 于 每 一 个 执行 部 件 需要 有 一 个 长 度 为 16 一 32 位 的 操作 段 , 因 
此 VLIW 处 理 的 指令 字 长 度 约 在 100 一 1000 位 之 间 。 典 型 的 机 器 有 Cydrome 公司 Cydra 5 
(1989 年 ) ,飞利浦 公司 的 TM-1(1996 年 )。VLIW 处 理 机 用 一 条 长 指令 实现 多 个 操作 的 并 
行 执行 ,以 减少 对 存储 器 的 访问 。 并 行 操作 主要 是 在 流水 的 执行 阶段 进行 的 ,如 图 12. 36 所 
示 ,在 执行 阶段 可 并 行 执行 3 个 操作 ,相当 于 指令 级 并 行 度 为 3。 
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图 12.36 VLIW 处 理 机 时 空 图 


VLIW 处 理 机 具有 以 下 主要 特点 : 超 长 指令 字 的 生成 是 由 编译 器 来 完成 的 ,由 它 将 串 
行 的 操作 序列 合并 为 可 并 行 执行 的 指令 序列 ,以 最 大 限度 实现 操作 并 行 性 ;采用 单一 的 控制 
流 , 只 设置 一 个 控制 器 ,每 个 时 钟 周期 启动 一 条 长 指令 ; 超 长 指令 字 被 分 成 多 个 控制 字段 ,每 
个 字段 直接 独立 地 控制 每 个 功能 部 件 ; 含 有 大 量 的 数据 通路 和 功能 部 件 ,由 于 编译 器 在 编译 
时 间 已 解决 可 能 出 现 的 数据 相关 和 资源 冲突 ,所 以 控制 硬件 比较 简单 。 


本 章 内 容 小 结 和 学 习 方法 建议 


流水 线 技术 是 一 种 经 济 、 有 效 的 时 间 并 行 技术 。 在 现代 计算 机 设计 中 得 到 了 最 广泛 的 
应 用 。 常 用 的 流水 线 表示 方法 有 连接 图 和 时 空 图 ,衡量 流水 线 的 主要 性 能 指标 有 加 速 比 、 知 
吐 率 和 效率 。 

流水 线 设 计 的 一 个 关键 问题 是 要 保证 流水 线 能 畅通 流动 ,阻碍 流水 线 畅通 的 主要 因素 
有 结构 相关 数据 相关 和 控制 相关 。 解 决 上 述 3 类 相关 最 简单 的 方法 是 使 流水 线 暂 时 停顿 ， 
直至 相关 条 件 消失 为 止 .但 是 这 将 使 流水 线 的 性 能 有 和 较 大 损失 。 减 少 或 消除 结构 相关 影响 
的 方法 主要 是 采用 资源 重复 方法 ;消除 数据 相关 的 有 效 方法 是 设置 专用 通路 以 尽快 将 运算 
结果 直接 送 到 使 用 它 的 地 方 ; 消 除 和 减少 控制 相关 的 方法 ,主要 是 加 速生 成 转移 目标 地 址 和 
采用 延迟 转移 技术 。 

尽管 指令 流水 线 技术 得 到 普遍 应 用 ,也 很 重要 ,但 从 教学 的 角度 看 , 它 在 课程 中 仍然 属 
于 提高 性 的 内 容 , 对 待 基础 性 知识 和 提高 性 的 内 容 有 一 个 合理 分 配 精力 的 问题 。 我 们 建议 ， 
学 生 首 先 要 比较 准确 地 掌握 多 指令 周期 CPU 的 组 成 和 指令 执行 过 程 ,理解 指令 流水 线 能 
够 为 系统 带 来 高 性 能 和 更 好 性 价 比 的 理由 ,了 解 它 带 来 的 问题 和 解决 问题 的 思路 ,对 那些 精 
力 有 点 不 够 的 学 生来 说 ,就 不 必 深 究 解决 3 类 相关 问题 的 具体 方案 与 技术 。 
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指令 级 并 行 技术 是 指 细 粒度 并 行 性 , 它 不 仅 包 括 时 间 并 行 技术 ,还 包括 空间 并 行 技术 。 
衡量 指令 级 并 行 性 的 一 个 指标 是 CPI, 为 了 得 到 理想 的 CPI 就 要 减少 流水 线 中 的 各 种 相关 ， 
如 果 要 想 使 CPI 能 够 低 于 1, 可 以 采用 多 指令 发 射 技术 , 即 在 一 个 时 钟 周期 内 发 射 多 条 指 
令 , 对 此 只 要 从 概念 上 理解 即 可 ,不 必 深 究 。 


习题 与 思考 题 


1. 指令 执行 过 程 采用 顺序 方式 ,一 次 重 闪 方式 和 流水 线 方式 ,它们 的 主要 差别 是 什么 ? 
各 有 什么 优点 和 缺点 ? 

2. 在 指令 流水 线 中 ,每 一 条 指令 执行 过 程 的 时 间 减 少 了 吗 ? 如果 没 变 减 少 ,那么 为 什 
么 还 要 采用 流水 线 技 术 呢 ? 一 般 来 说 流水 线 有 哪些 特点 ? 总 结 流水 线 的 各 种 分 类 方法 的 分 
类 原则 。 

3. 描述 CPU 时 常用 CPI( 每 条 指令 平均 时 钟 周 期 数 )、MIPS( 每 秒 百 万 条 指令 数 )、 
MFLOPS( 每 秒 百 万 次 浮 点 操作 数 ) 这 样 的 量 来 表征 。 请 写 出 它们 的 定义 式 ,并 求 出 MIPS、 
CPI 与 CPU 时 钟 频率 / 的 关系 。 

4. 假设 一 条 指令 的 执行 过 程 分 为 * 取 指令 ”“ 分 析 ” 和 “执行 "3 段 ,每 段 的 时 间 分 别 是 
At、2At 和 3At。 在 下 列 各 种 情况 下 ,分 别 写 出 连续 执行 n 条 指令 所 需要 的 时 间 表 达 式 。 
@ 顺 序 执行 ; 加 仅 “ 取 指令 ”和 "执行" 重 释 ; @* 取 指令 ”“ 分 析 ” 和 “执行 " 重 肝 。 

5. 有 一 条 由 4 个 功能 段 组 成 的 流水 线 , 每 个 功能 段 都 使 用 1 个 时 钟 周期 ,周期 长 度 为 
AL。 每 输入 5 条 指令 后 停顿 2 个 时 钟 周期 , 求 此 流水 线 的 实际 加 速 比 .吞吐 率 和 效率 。 

6. 一 条 线性 静态 多 功能 流水 线 由 6 个 功能 段 组 成 ,加 法 操作 使 用 其 中 1.2.3 .6 功能 
段 ,乘法 操作 使 用 其 中 1.4.5、6 功能 段 ,每 个 功能 段 的 延迟 时 间 都 相等 。 流 水 线 的 输入 端 和 
输出 端 之 间 有 直接 数据 通路 ,而 且 设 置 有 足够 的 缓冲 寄存 器 。 用 这 条 流水 线 计算 下 = 


2 (Ai x Bi) , 面 出 流水 线 时 空 图 ,并 计算 流水 线 的 实际 奉 吐 率 、 加 速 比 和 效率 。 
这 1 


7. 流水 线 有 m 段 ,各 段 的 延迟 时 间 分 别 是 4(i 二 1,2,…,m), 现 有 nn 个 任务 需要 完成 ， 
并 且 每 个 任务 都 需要 流水 线 各 有 段 实现 ,请 计算 : 流水 线 完成 这 个 任务 所 需要 的 时 间 ; 
@@ 和 非 流水 线 实现 相 比 ,这 个 任务 流水 实现 的 加 速 比 是 多 少 ? 加 速 比 的 峰值 又 是 多 少 ? 

8. 什么 是 流水 线 的 相关 问题 ? 通常 都 有 哪 几 类 相关 问题 ? 这 些 相 关 问 题 都 是 什么 原 
因 造 成 的 ? 各 种 相关 问题 都 有 哪些 解决 方法 ? 

9. 一 条 有 3 个 功能 段 的 流水 线 ,每 个 功能 段 的 延迟 时 间 都 相等 ,为 At。 其 中 功能 段 2 
的 输出 要 返回 它 自己 的 输入 端 循环 一 次 ,然后 再 流 到 功能 段 3。 请 问 : 四 如 果 每 隔 一 个 At 
向 流水 线 的 输入 端 连续 输入 任务 ,这 条 流水 线 会 发 生 什么 情况 ?@ 求 这 条 流水 线 能 够 正常 
工作 的 最 大 吞吐 率 . 加 速 比 和 效率 。@ 加 有 什么 方法 能 够 提高 这 条 流水 线 的 吞吐 率 ? 

10. 假设 分 支 目 标 缓冲 的 命中 率 是 90% ,程序 中 无 条 件 转移 指令 的 比例 是 5% ,没有 无 
条 件 转移 指令 的 程序 CPI 为 1。 假设 分 支 目标 缓冲 中 包含 分 支 目 标 指令 ,允许 无 条 件 转移 
指令 进入 分 支 目标 缓冲 , 则 程序 的 CPI 值 是 多 少 ? 

11. 什么 是 多 指令 发 射 技术 ? 多 指令 发 射 有 几 种 方式 ? 每 种 方式 的 特点 是 什么 ? 
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随 着 计算 机 速度 的 提高 ,人 们 对 计算 机 性 能 的 要 求 也 越 来 越 高 。 因 此 ,为 了 使 计算 机 能 
够 处 理 越 来 越 复杂 的 问题 ,计算 机 体系 结构 设计 者 把 注意 力 转 向 了 并 行 计算 机 。 本 章 从 计 
算 机 体系 结构 的 发 展 和 分 类 入 手 ,讨论 了 计算 机 体系 结构 不 同 层次 的 并 行 性 ,重点 对 并 行 计 
算 机 系统 设计 中 的 主要 问题 进行 了 分 析 , 并 且 在 此 基础 上 介绍 了 SIMD 和 MIMD 并 行 计算 
机 等 相关 内 容 。 在 并 行 计算 机 体系 结构 领域 内 ,人 们 已 经 进行 了 大 量 的 研究 工作 ,本 章 只 能 
讨论 其 中 的 一 小 部 分 。 


13.1 计算 机 体系 结构 概述 


13.1.1 计算 机 体系 结构 的 发 展 


在 本 书 的 第 1 章 中 已 经 概要 介绍 了 计算 体系 结构 的 发 展 情况 ,从 世界 上 出 现 第 一 台 计 
算 机 到 现在 的 50 多 年 里 ,计算 机 体系 结构 已 经 取得 了 重大 的 进展 ,但 大 多 数 的 计算 机 体系 
结构 仍然 没有 摆脱 冯 “ 诺 依 曼 机 器 结构 的 范畴 。 

随 着 技术 的 进步 ,当前 计算 机 体系 结构 主要 是 沿 着 两 个 方向 发 展 。 第 一 个 发 展 方向 是 
改变 冯 ，。 诺 依 曼 机 器 的 串 行 执行 模式 ,第 二 个 发 展 方向 是 改变 冯 。 诺 依 曼 机 器 的 控制 驱动 
方式 。 就 当前 的 发 展 状况 而 言 .第 一 种 发 展 方向 , 即 控制 驱动 方式 下 并 行 处 理 体 系 结构 的 计 
算 机 ,已 经 取得 了 重大 进展 和 一 系列 的 成 果 。 不 论 是 硬件 技术 还 是 相应 的 软件 技术 都 已 经 
相当 成 熟 , 并 且 有 很 多 产品 走向 市 场 ,获得 了 广泛 的 应 用 ,它们 代表 了 当前 计算 机 体系 结构 
发 展 的 主流 。 而 第 二 种 发 展 方向 ,除了 数据 流 计 算 机 已 经 有 了 一 些 成 型 的 计算 机 之 外 ,大 多 
数 还 属于 探索 .研究 阶段 ,还 需要 进行 大 量 的 工作 。 本 章 的 重点 就 在 于 介绍 计算 机 体系 结构 
的 第 一 种 发 展 方向 的 相关 成 果 。 

可 以 在 计算 机 体系 结构 的 不 同 层次 引入 并 行 机 制 。 在 最 底层 ,可 以 通过 流水 线 和 使 
多 个 功能 单元 的 超标 量 设计 将 并 行 加 入 到 CPU 芯片 ,可 以 通过 使 用 隐 式 并 行 的 超 长 指令 
字 来 加 入 并 行 , 也 可 以 在 CPU 中 加 入 一 些 特殊 的 特性 来 同时 控制 多 线程 ,甚至 将 多 个 CPU 
放 到 同一 个 芯片 里 组 成 多 核 处 理 器 。 接 下 来 一 个 层次 ,可 以 将 具有 额外 处 理 能 力 的 附加 
CPU 加 入 到 系统 中 。 通 常 .这 些 插件 CPU 都 具有 特殊 的 功能 ,例如 网 络 分 组 处 理 、 多 媒体 
处 理 或 者 加 密 解 密 等 。 将 并 行 机 制 引入 上 述 两 个 层次 一 般 能 够 把 计算 机 的 性 能 提高 5 一 
10 倍 。 
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然而 ,如 果 想 要 将 性 能 提高 百倍 \ 千 倍 甚至 数 万 倍 ,就 必须 使 用 多 个 CPU, 让 它们 一 起 
高 效 地 工作 ,这 种 思想 造就 了 大 规模 多 处 理 器 和 多 计算 机 系统 。 毫 无 疑问 ,将 成 千 上 万 的 处 
理 器 连接 成 一 个 大 的 系统 必然 会 带 来 需要 解决 的 许多 新 问题 。 

当 两 个 CPU 或 者 处 理 元 件 紧密 连 在 一 起 的 时 候 , 它 们 之 间 具 有 高 带宽 和 低 延 时 ,而 且 
是 亲密 计算 ,此 时 称 它们 为 紧密 耦合 。 相 反 , 当 它们 间隔 较 远 ,具有 低 带 宽 高 延 时 ,而 且 是 远 
程 计 算 , 此 时 称 它们 为 松散 耦合 。 在 大 多 数 情况 下 ,松散 耦合 的 系统 适 于 解决 粗 粒 度 的 问 
题 , 而 紧密 耦合 的 系统 适 于 解决 细 粒 度 的 问题 。 图 13. 1 给 出 了 不 同 层次 并 行 技术 的 图 示 。 
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图 13.1 计算 机 体系 结构 不 同 层次 的 并 行 性 


并 行 计算 机 系统 的 研究 之 所 以 在 近年 来 取得 了 重大 的 进展 ,不 仅 从 几 台 或 几 十 台 处 理 
器 组 成 的 简单 系统 发 展 到 成 百 上 千 台 处 理 机 组 成 的 大 规模 并 行 系统 ,而 且 从 科研 单位 ` 政 府 
部 门 专 用 的 并 行 计算 机 发 展 到 走向 商品 销售 领域 的 商用 并 行 计算 机 系统 ,其 中 主要 的 原因 
有 如 下 的 几 个 方面 。 

首先 , 随 着 计算 机 速度 的 提高 ,人 们 对 计算 机 性 能 的 要 求 也 越 来 越 高 。 天 文学 家 希望 使 
用 计算 机 来 模拟 整个 宇宙 演化 的 过 程 ,药物 学 家 希望 使 用 计算 机 设计 用 于 治疗 特殊 疾病 的 
药品 ,飞机 设计 师 总 是 希望 能 设计 出 更 加 节约 燃料 的 飞机 。 总 而 言 之 ,无 论 现在 计算 机 的 能 
力 多 么 强大 ,对 于 许多 用 户 来 说 ,尤其 是 把 计算 机 用 于 科学 计算 、 工 程 和 工业 设计 的 用 户 来 
说 ,仍然 远 远 不 够 。 

其 次 ,大 量 商品 化 的 处 理 器 的 出 现 为 设计 并 行 计算 机 系统 提供 了 可 能 。 当 代 的 并 行 计 
算 机 系统 大 都 以 PC 机 或 者 工作 站 这 样 的 单个 处 理 机 作为 系统 的 基本 构件 ,面向 商业 销售 
的 具有 较 高 性 能 价格 比 的 RISC 处 理 器 产品 的 大 量 出 现 ,为 并 行 计 算 机 设计 提供 了 较 大 的 
选择 余地 ,也 为 系统 性 能 的 全 面 提高 提供 了 坚实 的 基础 。 

最 后 ,并行 计算 机 系统 获得 快速 发 展 和 处 理 机 间 通 信 技 术 的 发 展 密 不 可 分 。 并 行 计算 
机 系统 中 大 量 的 多 处 理 机 要 能 够 高 效 地 协同 工作 .处 理 机 之 间 的 通信 和 是 至 关 重 要 的 。 它 们 
或 者 以 共享 内 存 变 量 或 者 以 消息 传递 机 制 来 进行 通信 。 各 种 互联 网 络 技术 现在 已 经 相当 成 
熟 ,从 理论 上 和 技术 上 为 并 行 计算 机 系统 的 发 展 准备 了 前 提 条 件 。 


13.1.2 计算 机 体系 结构 的 分 类 


过 去 曾 普 遍 将 计算 机 系统 分 为 巨 、 大 中、 小、 微型 机 5 类 ,这 是 按照 规模 ,性 能 、 速 度 以 
及 价格 的 一 种 大 致 划分 。 这 种 划分 计算 机 系统 的 方法 只 能 对 同时 期 的 计算 机 大 致 分 类 ,而 


并行 计算 机 体系 结构 


各 种 计算 机 系统 的 规模 ,价格 ,尤其 是 性 能 和 速度 的 指标 随 着 时 间 的 变化 而 变化 。 而 且 这 种 
分 类 方法 也 不 能 反映 计算 机 的 体系 结构 特征 。 

1966 年 ,Michael. J. Flynn 提出 按 指令 流 和 数据 流 的 多 倍 性 对 计算 机 体系 结构 进行 分 
类 。 由 于 当前 的 计算 机 体系 结构 主流 发 展 方向 是 控制 驱动 方式 下 的 并 行 处 理 , 因 此 这 一 分 
类 法 获得 了 普遍 的 赞同 ,虽然 这 种 分 类 法 也 是 非常 粗略 的 。 表 13. 1 是 Flynn 分 类 法 。 


表 13.1 计算 机 体系 结构 的 Flynn 分 类 法 














指令 流 数据 流 名 称 举 例 
1 个 1 个 SISD 传统 的 汉 “。 诺 依 曼 计算 机 
1 本 多 个 SIMD 超级 向 量 处 理 机 ,阵列 处 理 机 
多 个 1 本 MISD 目前 还 没有 
多 个 多 个 MIMD 多 处 理 机 ,多 计算 机 











Flynn 分 类 法 是 基于 指令 流 (Instruction Stream) 和 数据 流 (Data Stream) 这 两 个 概念 
的 。 指 令 流 是 指 机 器 执行 的 指令 序列 ;数据 流 就 是 由 指令 流 调 用 的 数据 序列 ,包括 输入 数据 
和 中 间 结 果 。 而 多 倍 性 是 指 在 系统 最 受 限 制 的 部 件 上 ,同时 处 于 同一 执行 阶段 的 指令 或 数 
据 的 最 大 数目 。 从 某 种 程度 上 说 ,指令 流 和 数据 流 是 互相 独立 的 ,因此 一 共存 在 4 种 组 合 。 
图 13. 2 分 别 表示 了 它们 的 基本 结构 (不 包括 I/O 设备 ) 。 
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(b) SIMD (d) MIMD 


图 13.2 Flynn 分 类 法 各 类 机 器 结构 
CU: 控制 部 件 ; PU: 处 理 部 件 ; MM: 存储 器 模块 ; IS: 指令 流 ; DS: 数据 流 


1. SISD 体系 结构 

这 种 体系 结构 代表 了 传统 的 冯 。 诺 依 曼 机 器 , 即 大 多 数 的 单机 (处 理 器 ) 系 统 。 人 处理 器 
串 行 执行 指令 或 者 处 理 器 内 采用 指令 流水 线 , 以 时 间 重 和 至 技术 实现 了 一 定 程 度 上 的 指令 并 
行 执行 ;甚至 于 处 理 器 是 超标 量 处 理 器 ,内 有 几 条 指令 流水 线 实 现 了 更 大 程度 上 的 指令 并 行 
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执行 。 但 它们 都 是 以 单一 的 指令 流 从 存储 器 取 指 令 ,以 单一 的 数据 流 从 存储 器 取 操 作 数 和 
将 结果 写 回 存储 器 。 

2. SIMD 体系 结构 

这 种 体系 结构 有 单一 的 控制 部 件 , 但 是 有 多 个 处 理 部 件 。 计 算 机 以 一 个 控制 单元 从 存 
储 器 取 单 一 的 指令 流 ,一 条 指令 同时 作用 到 各 个 处 理 单元 ,控制 各 个 处 理 单元 对 来 自 不 同 数 
据 流 的 数据 组 进行 操作 。 这 种 体系 结构 的 典型 代表 是 阵列 处 理 机 ,一 些 学 者 认为 将 向 量 处 
理 机 也 划 入 此 类 。 值 得 一 提 的 是 当前 的 很 多 种 处 理 器 都 具有 多 媒体 指令 功能 ,如 Intel 的 
Pentium 了 /上 的 MMX 指令 等 。 这 类 指令 能 够 对 打包 数据 中 的 多 个 数据 元 素 同 时 进行 操 
作 。 这 是 SIMD 的 一 种 变异 ,通常 被 简称 为 SIMD 类 指令 。 

3. MISD 体系 结构 

这 种 体系 结构 中 ,有 几 个 处 理 部 件 ,各 配 有 相应 的 控制 部 件 。 各 个 处 理 部 件 接收 不 同 的 
指令 ,多 条 指令 同时 在 一 份 数据 上 进行 操作 。 这 种 计算 机 体系 结构 是 一 种 比较 奇怪 的 组 合 ， 
这 已 经 被 证 明 是 不 可 能 至 少 是 不 实际 的 ,目前 为 止 还 不 存在 这 种 类 型 的 计算 机 。 

4. MIMD 体系 结构 

这 种 体系 结构 中 ,同时 有 多 个 处 理 部 件 , 并 且 每 个 处 理 部 件 都 配 有 相应 的 控制 部 件 。 各 
个 处 理 部 件 可 以 接收 不 同 的 指令 并 对 不 同 的 数据 流 进 行 操作 。 大 多 数 现代 的 并 行 计算 机 都 
属于 这 一 类 。 多 处 理 机 系统 和 多 计算 机 系统 都 是 MIMD 型 的 计算 机 。 

总 之 ,Flynn 分 类 法 能 够 反映 大 多 数 计算 机 系统 的 并 行 性 .工作 方式 和 结构 特点 ,但 它 
分 类 的 对 象 主要 是 控制 驱动 方式 下 的 串 行 处 理 和 并 行 处 理 计 算 机 。 对 于 非 控 制 驱 动 方式 的 
计算 机 ,如 数据 流 计算 机 ,就 不 能 采用 Flynn 分 类 法 。 正 是 因为 这 些 原 因 , 其 他 的 学 者 也 提 
出 了 一 些 其 他 的 分 类 法 ,如 美 籍 华人 冯 泽 云 教 授 在 1972 年 提出 了 按 最 大 并 行 度 来 定量 描述 
各 种 计算 机 系统 的 冯 氏 分 类 法 ;又 如 Wolfgan Handler 在 冯 氏 分 类 法 的 基础 上 ,于 1977 年 
根据 并 行 度 和 流水 线 提出 了 另外 一 种 分 类 法 。 此 外 还 有 其 他 很 多 分 类 方法 ,这 里 就 不 详细 
介绍 了 ,读者 可 以 参阅 有 关 资 料 。 


13.1.3 并 行 计算 机 体系 结构 分 类 


依据 计算 机 体系 结构 Flynn 分 类 法 ,一 般 来 说 可 以 将 并 行 计算 机 系统 分 为 4 类, 即 
SIMD 阵列 处 理 机 、SIMD 向 量 处 理 机 、MIMD 多 处 理 机 和 MIMD 多 计算 机 。 图 13. 3 是 按 
照 Flynn 分 类 法 归纳 的 并 行 计算 机 体系 结构 图 谱 。 


计算 机 系统 结构 
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SIMD 体系 结构 可 以 分 成 两 个 子 类 。 第 一 类 是 用 于 数值 计算 的 超级 计算 机 和 其 他 一 些 
向 量 处 理 机 ,它们 可 以 在 一 个 向 量 的 每 个 元 素 上 执行 相同 的 操作 。 一 般 来 说 向 量 处 理 机 是 
以 流水 线 式 ALU 为 核心 ,实现 向 量 各 个 元 素 的 并 行 计算 采用 的 是 时 间 重 闪 技 术 。 第 二 类 
是 处 理 并 行 类 型 的 阵列 处 理 机 ,这 类 计算 机 采用 资源 重复 方法 引入 空间 因素 , 即 在 系统 中 设 
置 多 个 相同 的 处 理 单元 来 开发 并 行 性 。 此 外 , 它 是 利用 并 行 性 中 的 同时 性 ,所 有 处 理 单元 必 
须 同时 进行 相同 操作 。 

在 图 13.3 的 分 类 中 ,我 们 把 MIMD 体系 结构 分 成 了 多 处 理 机 系统 和 多 计算 机 系统 ,前 
者 是 基于 共享 内 存 的 计算 机 系统 ,而 后 者 是 易于 消息 传递 的 计算 机 系统 。 

因为 在 大 多 数 MIMD 多 处 理 机 系统 中 内 存 都 被 分 成 了 多 个 不 同 的 模块 ,所 以 根据 共享 
内 存 的 模块 组 织 方式 可 以 把 多 处 理 机 系统 分 成 3 类 , 分 别 是 一 致 性 内 存 访问 计算 机 
(Uniform Memory Access, UMA), 非 一 致 性 内 存 访问 计算 机 (NonUniform Memory 
Access,NUMA) 和 只 高 速 缓存 访问 计算 机 (Cache Only Memory Access,COMA) 。 

MIMD 计算 机 的 另 一 个 大 类 是 多 计算 机 系统 ,多 计算 机 系统 在 体系 结构 层 没有 共享 的 
第 一 级 内 存 。 换 名 话说 ,在 多 计算 机 系统 中 ,CPU 上 运行 的 操作 系统 不 能 通过 Load/Store 
指令 访问 其 他 计算 机 的 内 存 , 它 只 能 通过 Send/Receive 这 样 的 操作 系统 原 语 显 式 地 发 送 消 
息 并 等 待 响应 的 方式 和 其 他 的 CPU 通信 。 操 作 系统 具有 通过 执行 Load/Store 指令 访问 远 
程 的 内 存 的 能 力 是 多 处 理 机 系统 不 同 于 多 计算 机 系统 的 最 重要 的 特征 。 

多 计算 机 系统 又 可 以 粗略 地 分 成 两 大 类 。 第 一 类 是 大 规模 并 行 处 理 机 (Massively 
Parallel Processors,MPP) ,这 是 一 种 价格 昂贵 的 超级 计算 机 , 它 是 由 许多 CPU 通过 专用 的 
高 速 互 联网 络 紧密 耦合 在 一 起 组 成 的 。 第 二 类 多 计算 机 系统 是 由 普通 的 PC 或 者 工作 站 组 
成 的 ,它们 可 能 被 放置 在 一 个 大 的 机 架 上 ,相互 之 间 通 过 商用 的 网 络 连接 起 来 ,比较 常用 的 
有 工作 站 网 络 (Network Of Workstations, NOW) 和 工作 站 集群 (Cluster Of Workstations , 
COW ) 。 

在 本 章 后 面部 分 .我 们 还 将 对 SIMD 阵列 处 理 机 、SIMD 向 量 处 理 机 、MIMD 多 处 理 机 
和 MIMD 多 计算 机 系统 进行 进一步 的 讨论 。 


13.2 并 行 计算 机 系统 的 设计 问题 


13.2.1 并 行 计算 机 系统 的 互联 网 络 


并 行 计算 机 的 通信 体系 结构 是 系统 的 核心 . 它 由 两 部 分 组 成 : 底层 的 互联 网 络 和 上 层 
的 语言 .软件 工具 包 、 编 译 器 .操作 系统 等 提供 的 通信 支持 。 底 层 的 互联 网 络 是 并 行 计算 机 
系统 内 部 的 互联 网 络 , 它 一 般 由 以 下 5 个 部 分 组 成 : CPU .内存 模 块 、 接 口 、. 链 路 和 交换 结 
点 。CPU 和 内 存 的 内 容 在 前 面 的 章节 中 已 经 讨论 过 ,这 里 也 就 不 再 歼 述 。 一 般 来 说 ,它们 
是 通信 的 端点 。 

接口 是 从 CPU 和 内 存 取得 消息 并 向 另外 的 CPU 和 内 存 发 送 消息 的 设备 。 在 许多 设 
计 方 案 中 ,接口 是 一 块 芯片 或 者 是 插 在 CPU 局 部 总 线 上 的 一 块 电路 板 , 这 样 就 可 以 和 CPU 
以 及 CPU 的 本 地 内 存 进行 交互 (如 果 有 本 地 内 存 )。 接 口内 部 一 般 都 有 一 个 可 编程 的 处 理 
器 :以 及 一 些 控 制 逻辑 和 控制 存储 器 。 此 外 还 有 一 些 私 有 的 RAM, 这 些 RAM 一 般 作为 输 
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入 和 输出 缓冲 器 。 通 常 接口 都 具有 读 写 不 同 内 存 的 能 力 , 因 为 这 样 才能 够 移动 数据 块 。 

链 路 是 传送 数据 位 的 物理 信道 。 链 路 可 以 是 电缆 、 双 绞 线 或 者 光纤 ,可 以 是 串 行 的 (1 
位 宽 ) 也 可 以 是 并 行 的 (多 于 1 位 )。 每 种 链 路 都 有 其 最 大 带宽 ,也 就 是 链 路 每 秒 能 够 传送 的 
最 大 比特 数 。 链 路 可 以 是 单 工 的 (单方 向 传送 ) . 半 双 工 的 ( 某 个 时 刻 只 能 传送 一 个 方向 的 数 
据 ) 和 全 双 工 的 (同时 两 个 方向 传送 ) 。 链 路 使 用 的 时 钟 机 制 可 以 是 同步 或 是 异步 的 。 

交换 结 点 是 互联 网 络 的 信息 交换 和 控制 站 点 , 它 是 具有 多 个 输入 端口 和 多 个 输出 端口 
的 设备 。 当 一 个 分 组 到 达 交 换 结 点 的 某 个 输入 端口 时 ,交换 结 点 将 使 用 分 组 中 的 某 些 位 来 
选择 分 组 的 输出 端口 。 通 常 ,交换 结 点 的 每 个 输入 端口 有 接收 器 和 输入 缓冲 器 ,每 个 输出 端 
口 有 输出 缓冲 器 和 发 送 器 。 此 外 还 有 实施 路 径 选 择 的 控制 逻辑 等 。 

在 设计 和 分 析 互 联网 络 时 ,有 几 个 问题 是 很 重要 的 。 首 先 就 是 互联 网 络 的 拓扑 结构 
(Topology) ;第 二 个 问题 就 是 互联 网 络 的 交换 结 点 如 何 工 作 ; 第 三 个 问题 是 为 了 能 把 消息 
高 效 地 传递 到 目的 地 应 该 使 用 何 种 寻 径 算法 。 下 面 就 简要 地 讨论 一 下 这 3 个 问题 。 

1. 互联 网 络 的 拓扑 结构 

互联 网 络 的 拓扑 结构 描述 了 链 路 和 交换 结 点 是 如 何 组 织 安排 的 。 拓 扑 结构 可 以 用 图 来 
表示 , 链 路 用 边 表示 ,交换 结 点 用 结 点 表示 ,如 图 13.4 所 示 。 互 联网 络 中 的 每 个 结 点 都 有 边 
与 之 相连 。 数 学 上 把 和 某 个 结 点 相连 的 边 的 数量 称 为 结 点 的 度 (Degree)。 一 般 来 说 , 结 点 
的 度 越 大 , 寻 径 选择 能 力 就 越 强 ,容错 能 力也 越 强 。 容 错 的 意思 是 说 当 某 条 链 路 失效 时 可 以 
绕 过 这 条 线路 继续 保持 系统 正常 工作 。 如 果 网 络 中 所 有 结 点 的 度 都 相同 ,此 网 络 称 为 对 称 


网 络 ,否则 称 为 非 对 称 网 络 。 
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图 13.4 互联 网 络 的 拓扑 结构 


互联 网 络 的 另 一 个 属性 是 直径 。 如 果 使 用 两 个 结 点 之 间 的 边 数 来 表示 两 个 结 点 之 间 的 
距离 ,那么 图 的 直径 就 是 图 中 相距 最 远 的 两 个 结 点 之 间 的 距离 。 互 联网 络 的 直径 直接 关系 
到 CPU 和 CPU 之 间 以 及 CPU 和 内 存 之 间 交 换 分 组 时 的 最 大 延迟 ,因为 通过 每 条 链 路 都 
要 花费 一 定 的 时 间 。 直 径 越 小 ,最 坏 情况 下 的 性 能 就 越 好 。 两 个 结 点 之 间 的 平均 距离 也 很 
重要 ,因为 它 关系 到 分 组 的 平均 传递 时 间 。 

传输 能 力 是 互联 网 络 的 另 一 个 很 重要 的 特性 :也 就 是 每 秒 能 传递 多 少数 据 。 互 联网 络 
的 传输 能 力 的 指标 之 一 被 称 为 对 分 带宽 (Bisection Bandwidth) 。 为 了 计算 对 分 带宽 ,首先 
需要 通过 移 走 图 中 的 一 些 边 . 把 网络 分 成 两 个 结 点 数 相等 而 且 不 相连 的 部 分 。 然 后 计算 移 
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走 的 边 的 带宽 之 和 。 因 为 可 以 有 许多 种 把 网 络 划 分 成 两 个 相等 部 分 的 方式 ,因而 也 就 会 得 
到 许多 个 值 ,对 分 带宽 就 是 所 有 这 些 值 中 最 小 的 。 这 个 数值 的 意义 在 于 如 果 对 分 带宽 是 
800b/s, 而 且 网 络 的 两 部 分 之 间 有 大 量 的 通信 ,那么 整个 流量 就 会 被 限制 在 800b/s 之 内 。 
许多 设计 者 认为 对 分 带宽 是 互联 网 络 最 重要 的 性 能 指标 。 

图 13.4 中 列 出 了 几 种 拓扑 结构 。 图 中 只 画 出 了 链 路 ( 边 ) 和 交换 结 点 (点 )。 内 存 和 
CPU 没有 画 出 来 ,它们 是 通过 接口 连接 在 交换 结 点 上 的 。 图 13.4(a) 是 一 个 星 型 (Star) 网 
络 ,CPU 和 内 存 连 接 在 外 围 的 结 点 上 ,中 间 结 点 只 做 交换 。 虽 然 这 种 设计 很 简单 ,但 是 对 一 
个 大 系统 来 说 ,中 间 的 交换 结 点 可 能 成 为 一 个 主要 的 瓶颈 。 另 外 ,从 容错 的 角度 来 看 ,这 也 
不 是 一 个 好 的 设计 ,因为 如 果 中 间 的 交换 结 点 出 了 问题 整个 系统 就 将 崩溃 。 
图 13. 4(b) 是 全 连接 (Full Interconnect) 网络 。 每 个 结 点 和 任何 一 个 其 他 的 结 点 之 间 
都 有 一 条 边 。 这 种 设计 的 对 分 带宽 最 大 ,直径 最 小 ,而 且 容 错 性 能 极 好 (损失 任意 6 条 边 仍 
然 能 够 完全 相连 )。 但 是 不 幸 的 是 ,对 于 上 个 结 点 来 说 ,全 连接 需要 k(k 一 1)/2 条 边 , 当 & 比 
较 大 时 , 边 的 数量 会 太 大 以 至 于 不 可 能 实现 。 
图 13. 4(c) 是 树 (Tree) 型 网 络 。 这 种 设计 的 问题 是 对 分 带宽 等 于 单条 链 路 的 容量 。 一 
般 来 说 ,靠近 树 的 顶部 的 结 点 流量 比较 大 ,因此 项 部 几 个 结 点 将 成 为 瓶颈 。 解 决 这 一 问题 的 
一 种 方法 是 给 顶部 的 链 路 增加 带宽 来 增 大 对 分 带宽 。 例 如 ,如 果 最 底层 的 链 路 的 容量 是 ，， 
上 一 层 的 容量 就 是 20, 顶 层 链 路 的 容量 就 是 40。 这 种 设计 方案 称 为 胖 树 (Fat Tree) ,该 方案 
已 经 用 于 某 些 商用 多 计算 机 系统 了 。 

图 13. 4(d) 是 环 型 (Ring) 网 络 , 而 图 13. 4(e) 是 网 格 型 (Grid 或 者 Mesh) 网 络 ,许多 商 
用 系统 都 使 用 了 这 种 结构 。 这 种 设计 很 有 规律 ,易于 扩展 ,而 且 直径 与 结 点 数 的 平方 根 成 正 
比 。 网 格 型 网 络 的 一 种 变 体 是 图 13.4(f) 中 所 示 的 双向 环 型 (Double Torus) 网 络 ,这 是 一 种 
把 边缘 结 点 连接 起 来 的 网 格 型 网 络 。 它 不 仅 容错 性 能 高 于 网 格 型 网 络 ,而 且 直 径 也 比 网 格 
型 网 络 小 ,因为 对 角 的 结 点 之 间 只 有 两 条 边 。 

图 13.4(g) 中 的 立方 体 (Cube) 网 络 ,是 一 种 规则 的 三 维 拓扑 结构 。 这 里 画 的 是 一 个 
2X2X2 的 立方 体 , 一 般 情况 下 可 以 是 kXkXk 的 立方 体 。 图 13.4(h) 中 是 一 个 四 维 的 立 
方 体 , 它 是 通过 把 两 个 三 维 立方 体 相应 的 结 点 连接 起 来 而 组 成 的 。n 维 的 立方 体 称 为 超 
立方 体 (Hypercube) ,许多 并 行 计算 机 使 用 这 种 拓扑 结构 是 由 于 直径 随 着 维 数 线性 增长 ， 
以 及 直径 是 结 点 数 以 2 为 底 的 对 数 。 但 是 超 立方 体 获得 比较 小 的 直径 是 以 结 点 度 的 增加 
作为 代价 的 ,也 就 是 链 路 的 数量 很 大 。 虽然 如 此 , 超 立 方 体 仍然 是 高 性 能 系统 的 通常 选 
择 的 方案 。 

总 结 上 面 的 讨论 ,假设 互联 网 络 规模 即 结 点 数目 为 N, 可 以 得 到 如 表 13. 2 所 列 的 各 种 
互联 网 络 的 特性 列表 。 








表 13.2 互联 网 络 特征 列表 














网 络 拓扑 结 点 的 度 网 络 直 径 对 分 带宽 网 络 维 数 备 注 

星 形 NM 一 3 2 N/2 0 

环形 2 N/2 下 

全 连接 N 一 1 下 CN/2)? 0 

树 形 3 20—D 1 0 上 二 logz N, 树 的 层 数 
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续 表 
网 络 拓扑 结 点 的 度 网 络 直径 对 分 带宽 网 络 维 数 备 注 
网 格 形 Bg 2(n—1) n 罗 n=VN 
双向 环形 4 n 2n 2 n=VN 
立方 体 k k N/2 k 上 二 logzNN ,网 的 维 数 

















除了 上 述 的 几 种 拓扑 结构 之 外 还 有 多 种 其 他 类 型 的 网 络 结构 ,这 里 就 不 逐一 介绍 了 。 
前 面 介绍 的 各 种 互联 网 络 中 的 连接 方式 在 系统 的 运行 过 程 中 不 会 改变 ,从 这 个 意义 上 讲 它 
们 都 是 静态 互联 网 络 。 与 此 相对 的 就 是 动态 互联 网 络 ,动态 互联 网 络 以 交换 通道 来 实现 , 包 
括 总 线 、 交 叉 开 关 和 多 级 交换 网 络 等 ,动态 互联 网 络 常用 于 UMA 和 NC-NUMA 多 处 理 机 
中 ,我 们 将 在 共享 内 存 的 多 处 理 机 一 节 中 对 动态 互联 网 络 进行 进一步 的 讨论 。 

2. 互联 网 络 的 交换 结 点 

互联 网 络 是 由 交换 结 点 和 连接 它们 的 链 路 组 成 的 。 图 13. 5 是 一 个 小 的 由 4 个 交换 结 
点 组 成 的 网 络 。 每 个 交换 结 点 都 有 4 个 输入 端口 和 4 个 输出 端口 。 另 外 ,每 个 交换 结 点 都 
有 CPU 和 互联 电路 (在 图 中 并 没有 全 部 画 出 来 )。 交 换 结 点 所 做 的 工作 就 是 接收 到 达 输入 
端口 的 分 组 然后 把 分 组 发 送 到 正确 的 输出 端口 。 每 个 输出 端口 都 通过 串 行 和 并 行 链 路 连接 
到 另 一 个 交换 结 点 的 输入 端口 ,这 些 链 路 在 图 13. 5 中 用 虚线 表示 。 
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图 13.5 4 个 交换 结 点 的 方 型 互联 网 络 


交换 结 点 有 多 种 设计 方案 。 一 种 方案 称 为 电路 交换 (Circuit Switching) ,在 发 送 分 组 之 
前 ,需要 预先 确定 从 源 到 目的 地 的 整个 路 径 。 所 有 的 端口 和 缓冲 区 都 预先 分 配 好 ,这 样 当 传 
输 开 始 时 ,所 有 必须 的 资源 都 确保 是 可 用 的 .数据 就 可 以 全 速 地 从 源 结 点 通过 交换 结 点 到 达 
目的 结 点 。 图 13. 5 中 的 交换 结 点 就 使 用 了 电路 交换 ,从 CPU; 到 CPU; 的 粗 实 线 就 是 一 条 
预定 的 电路 。 这 条 电路 使 用 了 3 个 输入 端口 和 3 个 输出 端口 。 

对 于 电路 交换 来 说 ,延迟 时 间 是 电路 建立 时 间 和 传输 时 间 之 和 。 为 了 建立 一 条 电路 , 首 
先 要 发 送 一 个 探测 分 组 预约 资源 并 报告 结果 。 在 发 送 探测 分 组 时 ,可 以 同时 装配 数据 分 组 。 
当 电路 建立 以 后 ,数据 分 组 就 可 以 全 速 传送 。 

电路 交换 的 优点 是 ,分 组 发 送 时 能 无 竞争 无 干扰 地 全 速 传 送 。 其 缺点 是 需要 提前 预定 
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和 预 留 ,网 络 资源 使 用 效率 低 。 另 外 ,为 建立 通路 常常 是 先 发 送 一 个 小 的 试探 分 组 去 预 留 资 
源 , 然 后 返回 一 个 报告 ,这 种 通路 建立 时 间 的 开销 是 比较 大 的 。 

第 二 种 交换 方案 是 存储 转发 分 组 交换 (Store-and-forward Packet Switching)。 这 种 方 
案 不 需要 事先 预约 资源 。 源 结 点 把 整个 分 组 发 送 给 第 一 个 交换 结 点 ,第 一 个 交换 结 点 把 分 
组 完全 保存 在 自己 内 部 。 在 图 13. 6(a) 中 ,CPU', 是 源 结 点 ,而 目的 地 是 CPU: 的 整个 分 组 ， 
将 首先 被 缓存 在 交换 结 点 A 中 。 一 旦 A 获得 了 完整 的 分 组 ,就 把 分 组 传递 给 交换 结 点 C， 
如 图 13. 6(b) 所 示 。 在 整个 分 组 到 达 交 换 结 点 C 后 ,分 组 将 被 送 往 交 换 结 点 D, 如 图 13. 6 
(c) 所 示 。 最 后 ,分 组 被 送 到 目的 地 CPU* 。 注 意 一 下 ,这 里 不 需要 预先 建立 连接 也 不 需要 
事先 预定 资源 。 
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图 13.6 存储 转发 分 组 交换 



















































































































































































存储 转发 交换 结 点 必须 能 够 缓冲 分 组 ,因为 当 数据 源 ( 比 如 ,CPU 内存 和 交换 结 点 ) 需 
要 传送 分 组 时 ,需要 的 输出 端口 可 能 正 忙于 传送 另外 一 个 分 组 。 如 果 没 有 缓冲 , 当 一 个 正在 
到 达 的 分 组 需要 使 用 一 个 正在 被 占用 的 端口 的 话 ,该 分 组 就 不 得 不 被 丢弃 ,势必 导致 互联 网 
络 的 可 靠 性 下 降 。 常 用 的 缓存 策略 有 输入 缓存 、 输 出 缓存 和 公共 缓冲 区 3 种 。 

存储 转发 分 组 交换 的 优点 是 不 需要 预约 资源 ,灵活 而 有 效 ;缺点 是 它 增 大 了 分 组 通过 互 
联网 络 的 延 时 。 而 且 对 分 组 交换 网 络 来 说 ,虽然 不 需要 事先 向 目的 结 点 发 送 探测 分 组 ,但 是 
仍然 需要 装配 分 组 的 时 间 。 此 外 ,为 保存 最 大 的 分 组 和 避免 几 条 通路 向 同一 个 结 点 传送 时 
造成 分 组 的 丢失 ,分 组 缓冲 区 应 比较 大 ,这 不 利于 VLSI 的 实现 。 

解决 该 存储 转发 分 组 交换 延 时 较 长 问题 的 一 种 方案 是 设计 一 种 同时 具有 电路 交换 的 特 
点 和 分 组 交换 的 特点 的 混合 网 络 。 例 如 ,可 以 从 逻辑 上 把 分 组 分 成 小 的 单元 。 只 要 第 一 个 
单元 到 达 了 交换 结 点 ,就 可 以 被 传送 到 下 一 个 交换 结 点 而 不 需要 等 待 所 有 的 单元 都 到 达 交 
换 结 点 。 这 种 策略 不 同 于 电路 交换 ,因为 它 不 需要 事先 进行 端 到 端的 资源 预约 。 因 此 可 能 
出 现 资源 (端口 和 缓冲 区 ) 的 竞争 。 在 虚拟 直通 寻 径 (Virtual Cut Through Routing ) 策略 
中 , 当 分 组 的 第 一 个 单元 不 能 移动 时 ,分 组 的 其 余 单元 可 以 继续 向 第 一 个 单元 所 在 的 结 点 传 
送 ,因此 在 最 坏 的 情况 下 ,虚拟 直通 就 变 成 了 存储 转发 分 组 交换 , 它 仍 然 需要 较 大 的 缓冲 区 。 
而 且 这 种 情况 下 的 延 时 与 存储 转发 分 组 交换 方式 一 样 .这 也 是 虚拟 直通 寻 径 方式 的 一 个 

虚拟 直通 寻 径 是 对 存储 转发 分 组 交换 方式 的 改进 , 虫 蚀 寻 径 (Wormhole Routing) 又 是 
对 虚拟 直通 寻 径 方式 的 改进 。 在 虫 亿 寻 径 策略 中 , 当 第 一 个 单元 不 能 移动 时 ,通知 源 结 点 ， 
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源 结 点 就 停止 传送 ,因此 分 组 就 像 一 条 虫子 一 样 停留 在 两 个 或 者 更 多 个 交换 结 点 中 。 当 需 
要 的 资源 可 用 后 ,分 组 继续 前 进 。 这 种 寻 径 方式 的 明显 优点 是 ,各 个 结 点 不 再 需要 大 的 分 组 
缓冲 区 ,只 要 较 小 的 分 组 单元 缓冲 区 就 可 以 了 ,这 样 也 有 利于 VLSI 实现 。 它 的 缺点 是 , 头 
单元 被 阻塞 时 后 面 所 有 的 数据 单元 也 被 阻塞 ,占用 了 较 多 的 结 点 ( 相 比 之 下 ,虚拟 直通 方式 
头 单元 受阻 时 只 占用 一 个 结 点 ) 。 

虚拟 直通 和 虫 蚀 寻 径 不 需要 发 送 探测 分 组 建立 电路 ,也 没有 存储 转发 延 时 。 因 此 ,一 般 
来 说 ,延迟 时 间 就 是 初始 装配 分 组 的 时 间 加 上 发 送 分 组 的 时 间 , 当 然 , 在 所 有 的 延迟 时 间 中 
都 应 该 有 传送 延迟 ,但 是 一 般 来 说 ,传送 延迟 很 小 。 

3. 互联 网 络 的 寻 径 算法 

在 任何 一 个 维 数 大 于 1 的 网 络 中 ,都 需要 选择 通过 哪 条 路 径 从 源 结 点 到 达 目 的 结 点 。 
一 般 情 况 下 ,存在 多 条 路 径 。 决 定 一 个 分 组 从 源 结 点 到 达 目 的 结 点 的 过 程 中 经 过 的 结 点 序 
列 的 算法 称 为 寻 径 算法 (Routing Algorithms) 。 

在 网 络 中 一 般 都 存在 多 条 路 径 , 因 此 需要 好 的 寻 径 算法 。 一 个 好 的 寻 径 算法 能 够 在 多 
个 链 路 上 分 担负 载 来 充分 利用 带宽 。 另 外 , 寻 径 算法 还 必须 避免 在 互联 网 络 中 出 现 死 锁 
(Deadlock) 现 象 。 当 互联 网 络 中 正在 传送 的 多 个 分 组 都 占用 着 别 的 分 组 需要 的 资源 将 导致 
死 锁 , 即 所 有 的 分 组 都 不 能 继续 传送 而 进入 无 限 等 待 资源 的 情况 。 

寻 径 算法 可 以 分 成 源 寻 径 (Source Routing) 和 分 布 式 寻 径 (Distributed Routing) 两 大 
类 。 在 源 寻 径 中 , 源 结 点 预先 决定 穿 过 互联 网 络 的 完整 的 路 径 , 使 用 路 径 中 每 个 结 点 的 端口 
号 的 列表 来 表示 。 在 分 布 式 寻 径 算 法 中 ,每 个 交换 结 点 自己 决定 把 到 达 的 分 组 发 送 到 哪个 
输出 端口 。 一 般 来 说 ,在 各 个 交换 结 点 都 设立 一 个 路 径 表 ,而 分 组 的 头 部 含有 一 个 寻 径 字 
段 , 用 于 说 明 分 组 的 目的 地 址 和 选择 路 径 的 依据 。 

如 果 算 法 对 所 有 到 相同 目的 结 点 的 分 组 都 做 出 相同 的 决策 ,那么 这 样 的 寻 径 算法 就 称 
为 静态 的 (Static) ; 如 果 算 法 在 做 路 径 选 择 时 考虑 了 当前 情况 ,该 算法 就 是 自 适应 的 
(Adaptive) , 自 适应 算法 要 比 静 态 算 法 复杂 得 多 。 有 关 这 些 内 容 的 深入 讨论 请 读者 参考 计 
算 机 网 络 类 书籍 和 相关 资料 。 


13.2.2 并 行 计 算 机 系统 的 性 能 问题 


设计 并 行 计算 机 的 目的 就 是 使 它 的 运行 速度 比 单 处 理 器 的 计算 机 快 。 如 果 不 能 实现 这 
一 目标 ,那么 所 有 的 努力 都 是 徒劳 的 。 此 外 ,我 们 还 应 该 用 尽 可 能 高 效率 的 方式 实现 这 一 目 
标 。 一 台 比 单 处 理 器 的 计算 机 快 两 倍 但 是 价格 却 贵 50 倍 的 并 行 计算 机 肯定 是 无 人 问津 的 。 
下 面 将 从 并 行 计 算 机 系统 的 主要 硬件 和 软件 性 能 指标 以 及 如 何 获得 更 高 的 性 能 等 方面 来 讨 
论 并 行 计算 机 体系 结构 的 性 能 问题 。 

1. 硬件 性 能 指标 

从 硬件 的 角度 来 说 ,重要 的 性 能 指标 是 CPU 和 输入 /输出 的 速度 以 及 互联 网 络 的 性 
能 。CPU 和 输入 /输出 的 速度 和 单 处 理 器 的 情况 一 样 ,因此 并 行 计算 机 中 关键 的 硬件 性 能 
指标 就 是 互联 网 络 的 性 能 。 互 联网 络 的 性 能 有 两 个 重要 的 指标 : 延 时 (Latency) 和 带宽 
(Bandwidth) 。 

延迟 时 间 是 指 从 CPU 发 送 分 组 至 接收 到 响应 的 时 间 间 隔 。 如 果 分 组 是 发 送 到 内 存 去 
的 ,那么 延迟 时 间 就 是 读 写 一 个 内 存 字 或 者 一 块 内 存 区 的 时 间 。 如 果 分 组 是 发 送 到 另 一 个 
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CPU 的 ,延迟 时 间 就 反映 了 使 用 该 大 小 分 组 的 处 理 器 之 间 的 通信 和 时间。 延迟 时 间 由 多 个 因 
素 决定 ,而 且 正 如 我 们 在 上 一 节 中 分 析 的 那样 ,电路 交换 ,分 组 交换 、 虚 拟 直 通路 和 虫 蚀 寻 径 
的 延迟 时 间 都 是 不 同 的 。 

另 一 个 硬件 性 能 指标 是 带宽 。 许 多 并 行程 序 ,特别 是 用 于 科学 计算 的 并 行程 序 往 往 需 
要 移动 大 量 的 数据 ,因此 系统 每 秒 能 够 移动 的 比特 数 就 成 了 系统 比较 关键 的 性 能 指标 。 关 
于 带宽 有 多 个 性 能 指标 。 我 们 前 面 已 经 讨论 了 对 分 带宽 , 另 一 个 带宽 指标 是 聚集 带宽 
(Aggregate Bandwidth) , 它 是 把 所 有 链 路 的 带宽 加 在 一 起 而 得 到 的 。 聚 集 带 宽 给 出 了 系统 
能 够 同时 传送 的 最 大 的 比特 数 。 此 外 ,还 有 一 个 重要 的 带宽 指标 是 按照 CPU 能 力 计 算 的 
平均 带宽 (Average Bandwidth) 。 

2. 软件 性 能 指标 

从 软件 的 角度 来 看 ,最 关键 的 性 能 指标 是 加 速 比 。 一 个 程序 在 有 个 处 理 器 的 计算 机 
上 运行 和 在 只 有 一 个 处 理 器 的 计算 机 上 运行 相 比 要 快 多 少 倍 。 

一 些 典 型 的 结果 如 图 13.7 所 示 。 图 中 夯 出 了 在 由 64 个 Pentium Pro CPU 组 成 的 多 
计算 机 系统 上 运行 几 个 不 同 的 并 行程 序 的 结果 。 每 条 曲线 都 反映 了 一 个 程序 的 加 速 比 ,加 
速 比 是 CPU 的 数量 k 的 函数 。 最 理想 情况 下 的 加 速 比 如 图 13. 7 中 的 虚线 所 示 , 使 用 个 
CPU 将 使 程序 运行 快 & 倍 ,并 且 对 于 任意 的 & 都 成 立 。 很 少 有 程序 能 够 获得 理想 的 加 速 
比 ,但 是 有 些 程序 比较 接近 理想 的 加 速 比 。 












N-body problem 


Linear speedup、 








训 = 宝生 “Skyline matrix inversion 
0 10 20 30 40 50 60 

Number of CPUs 
图 13.7 实际 程序 获得 的 加 速 比 总 是 低 于 线性 加 速 比 





理想 的 加 速 比 不 可 能 达到 的 部 分 原因 在 于 几乎 所 有 的 程序 都 有 串 行 部 分 ,比如 程序 的 
初始 化 .数据 读 人 和 结果 合并 等 。 在 这 些 地 方 ,.CPU 再 多 也 没有 用 。 假 定 一 个 程序 在 单 处 
理 器 的 计算 机 上 运行 需要 工 秒 , 其 中 一 部 分 是 串 行 代码 ,所 占 比 例 记 为 /, 那 么 剩余 的 (1 一 
让 就 是 可 以 并 行 的 。 如 果 后 一 部 分 代码 运行 在 个 CPU 上 而 且 没 有 任何 其 他 开销 ,那么 
在 最 理想 的 情况 下 ,执行 时 间 可 以 从 (1 一 让 本 减少 到 (1 一 /T/n。 那 么 串 行 部 分 加 并 行 部 
分 的 整个 执行 时 间 就 是 /XT 十 (1 一 /) T/n。 加 速 比 就 是 原来 程序 的 执行 时 间 除 以 新 的 程 
序 的 执行 时 间 , 即 


7 
Sheedup =— Tem 


如 果 /一 0 ,我 们 就 可 以 获得 线性 加 速 比 ;但 是 如 果 { 僵 0. 就 不 可 能 得 到 理想 加 速 比 , 因 
为 存在 串 行 部 分 。 这 就 是 Amdahl 定律 。 但 是 ,Amdahl 定律 并 不 是 不 能 获得 理想 加 速 比 的 
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唯一 原因 。 通 信和 延迟 时 间 、 有 限 的 通信 带宽 和 算法 的 效率 都 会 影响 程序 的 加 速 比 。 

3. 获得 更 高 的 性 能 

提高 性 能 的 最 直接 的 办 法 就 是 给 系统 增加 更 多 的 CPU。 但 是 ,增加 CPU 时 要 注意 
不 要 产生 任何 瓶颈 。 为 了 更 好 地 理解 前 面 所 提 到 的 可 扩展 性 的 含义 ,我 们 来 看 一 下 
图 13.8(a) 中 的 4 个 CPU 通过 总 线 相连 的 例子 。 现 在 我 们 给 该 系统 增加 12 个 CPU ,使 
CPU 数目 增加 到 16 个 ,如 图 13.8(b) 所 示 。 如 果 总 线 的 带宽 是 ZM b/s, 那 么 由 于 CPU 
数量 增加 了 4 倍 ,每 个 CPU 可 用 带宽 就 从 5b/4 M b/s 降低 到 b/16 M b/s。 这 样 的 系统 被 
认为 是 不 可 扩展 的 。 


























































































































































































































CPU 
口 口 口 口 口 
| I | | 
总 线 串 
(a) 4 个 CPU 的 基于 总 线 的 系统 (b) 16 个 CPU 的 基于 总 线 的 系统 
] 
HH 
(ec) 4 个 CPU 的 基于 网 格 的 系统 (d) 16 个 CPU 的 基于 网 格 的 系统 





图 13.8 不 同 数目 CPU 的 互联 网 络 


下 面 对 基 于 网 格 网 络 的 系统 做 同样 的 扩展 ,如 图 13. 8Cc) 和 13. 8(d) 所 示 。 使 用 这 种 拓 
扑 结构 ,增加 新 的 CPU 时 也 要 增加 相应 的 链 路 ,因此 系统 的 扩展 并 不 会 像 基于 总 线 的 系统 
那样 导致 每 个 CPU 的 平均 带宽 的 下 降 。 实 际 上 , 链 路 和 CPU 的 比例 从 4 个 CPU 时 的 1.0 
(4 个 CPU.4 条 链 路 ) 提 高 到 了 16 个 CPU 时 的 1.5(16 个 CPU,24 条 链 路 ) ,因此 ,CPU 的 
增加 相应 地 提高 了 CPU 的 平均 带宽 。 

当然 ,带宽 并 不 是 唯一 的 问题 。 为 总 线 系统 增加 CPU 并 不 增加 互联 网 络 的 直径 以 及 
没有 竞争 情况 下 的 线路 延 时 ,而 网 格 网 络 系统 则 不 是 这 样 。 对 于 7X7 的 网 格 网 络 来 说 , 直 
径 是 2(n 一 1) ,因此 最 坏 情况 的 延 时 增长 大 约 是 和 CPU 数目 的 平方 根 成 正比 的 。 

理想 情况 下 .一 个 可 扩展 的 系统 随 着 CPU 的 增加 应 该 能 够 保持 相同 的 CPU 平均 带宽 
和 不 变 的 平均 延迟 时 间 。 而 在 实际 中 ,保持 CPU 足够 的 带宽 是 可 以 做 到 的 ,但 是 在 所 有 实 
际 的 设计 方案 中 ,延迟 时 间 总 是 随 着 CPU 数量 的 增长 而 增长 。 使 延迟 时 间 按 照 CPU 数量 
的 对 数 增长 ,就 像 超 立方 体 那 样 ,就 已 经 是 最 好 的 方案 了 。 


13.2.3 并 行 计算 机 系统 的 软件 问题 


软件 问题 在 讨论 并 行 计 算 机 体系 结构 的 时 候 也 是 非常 重要 的 ,如 果 没 有 并 行 软件 ,并 行 
硬件 基本 上 就 没有 什么 用 处 ,因此 ,好 的 硬件 设计 师 在 设计 硬件 时 就 考虑 了 软件 的 需求 。 并 
行 计算 机 的 软件 有 4 种 一 般 的 设计 方法 。 

第 一 种 方法 是 为 普通 的 串 行 语言 增加 特殊 的 函数 库 。 例 如 ,程序 员 可 以 编写 调用 转换 
大 矩阵 的 库 函 数 和 解 偏 微分 方程 组 的 库 函 数 的 串 行 程序 而 不 用 知道 这 些 库 函 数 实际 上 是 并 
行 执行 的 。 这 种 方法 的 问题 在 于 只 是 在 很 少 的 库 函 数 中 实现 了 并 行 性 ,而 大 量 的 程序 代码 
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仍然 是 串 行 的 。 

第 二 种 方法 是 为 编程 语言 增加 包括 通信 和 控制 原 语 的 库 函 数 。 程 序 员 仍 然 使 用 传统 的 
编程 语言 编程 ,但 是 程序 员 需 要 使 用 这 些 原 语 来 创建 和 管理 并 行 性 。 

第 三 种 方法 是 为 现 有 的 编程 语言 增加 一 些 特 殊 的 结构 ,比如 可 以 很 容易 地 创建 新 的 并 
行进 程 的 能 力 , 并 行 执 行 循环 的 能 力 和 同时 对 一 个 向 量 的 所 有 元 素 执行 算术 运算 的 能 力 。 
这 种 方法 目前 被 广泛 使 用 ,许多 编程 语言 都 被 修改 成 包括 这 些 并 行 机 制 。 

第 四 种 方法 是 发 明 一 种 全 新 的 用 于 并 行 处 理 的 语言 。 使 用 新 语言 的 一 个 显而易见 的 优 
势 是 这 样 的 语言 肯定 很 适合 于 并 行 处 理 , 但 是 缺点 也 同样 明显 ,程序 员 必 须 学 习 一 种 新 
语言 。 

虽然 目前 已 经 有 许多 用 于 并 行 编程 的 函数 库 、 编 程 语言 扩展 和 新 的 并 行 编程 语言 ,但 是 
所 有 并 行 计算 机 软件 的 核心 不 外 乎 5 个 关键 问题 , 即 控制 模式 .并 行 粒度 .计算 模式 .通信 方 
式 和 同步 原 语 , 一 个 好 的 并 行 计算 机 软件 必须 解决 好 这 几 个 问题 。 


13.3 SIMD 计算 机 简介 


SIMD 是 单 指令 流 多 数据 流 计 算 机 , 主要 用 于 解决 使 用 向 量 和 阵列 这 样 比较 规整 的 数 
据 结构 的 复杂 的 科学 计算 和 工程 计算 问题 。 这 种 计算 机 只 有 一 个 控制 单元 ,每 次 只 能 执行 
一 条 指令 ,但 是 这 一 条 指令 可 以 同时 对 多 个 数据 进行 操作 。SIMD 计算 机 可 以 分 为 阵列 处 
理 机 和 向 量 处 理 机 两 大 类 。 下 面 我 们 就 对 这 两 种 类 型 的 计算 机 进行 简单 的 介绍 。 


13.3.1 阵列 处 理 机 


阵列 处 理 机 的 思想 早 在 40 多 年 前 就 提出 来 了 。 然 而 ,在 那 以 后 又 过 了 10 年 第 一 台 为 
NASA 服务 的 阵列 处 理 机 ILLIAC 信 才 建造 完成 并 投入 实际 使 用 ,ILLIAC 信也 是 SIMD 
计算 机 的 原型 。 从 那 时 起 ,多 家 公司 都 开始 制造 商用 的 阵列 处 理 机 ,包括 Thinking 
Machine 公司 的 CM-2 和 Maspar 公司 的 MP-2, 但 是 没有 一 家 公司 在 市 场 上 取得 较 大 的 
成 功 。 

阵列 处 理 机 使 用 的 基本 思想 是 一 个 单一 的 控制 单元 提供 信号 驱动 多 个 处 理 单元 同时 运 
行 ,如 图 13.9 所 示 。 每 个 处 理 器 单元 都 由 CPU 或 者 是 功能 增强 的 ALU 和 本 地 内 存 组 成 。 
由 于 所 有 的 处 理 单 元 都 是 由 一 个 控制 单元 驱动 的 .因此 它们 的 执行 是 同步 的 。 虽 然 所 有 的 
控制 器 
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图 13.9 ILLIAC KW 型 阵列 处 理 机 
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阵列 处 理 机 都 遵循 这 一 通用 的 模式 ,但 是 在 具体 设计 时 不 同 的 阵列 处 理 机 仍然 有 不 同 之 处 。 

第 一 个 不 同 就 是 处 理 单元 的 结构 。 处 理 单元 的 结构 可 能 很 简单 ,也 可 能 很 复杂 。 从 简 
单 的 角度 来 说 ,最 简单 的 处 理 单元 可 能 就 是 一 个 1 位 的 ALU ,就 像 CM-2 中 的 处 理 单元 那 
样 。 处 理 单元 也 可 以 采用 8 位 的 ALU、32 位 的 ALU 或 者 带 浮 点 计算 能 力 的 更 加 强劲 的 处 
理 单元 。 从 某 种 程度 上 来 说 ,采用 什么 样 的 处 理 单元 取决 于 机 器 的 设计 目标 。 如 果 是 用 于 
数值 计算 ,就 需要 浮 点 计算 能 力 ;如 果 是 用 于 信息 处 理 ,也 可 能 不 需要 浮 点 计算 能 力 。 

第 二 个 不 同 是 处 理 单元 如 何 连 接 。 从 原理 上 来 说 ,图 13.4 中 列 出 的 所 有 的 拓扑 结构 都 
是 可 行 的 。 方 格 型 网 络 是 比较 常用 的 结构 ,它们 适合 处 理 许多 二 维 的 问题 包括 矩阵 计算 和 
图 像 处 理 , 方 格 型 网 络 还 具有 良好 的 可 扩展 性 ,在 增加 处 理 器 数量 的 同时 可 以 自动 地 增加 
带宽 。 

第 三 个 不 同 是 处 理 单元 的 自治 能 力 有 多 强 。 在 我 们 讨论 的 这 种 设计 中 ,控制 单元 告诉 
处 理 单元 执行 什么 指令 ,但 是 在 许多 阵列 处 理 机 中 ,每 个 处 理 单元 都 可 以 选择 执行 或 者 不 执 
行 某 条 指令 ,选择 的 依据 是 处 理 单元 的 本 地 数据 ,比如 条 件 代码 中 的 某 些 位 。 这 一 特性 给 阵 
列 处 理 机 带 来 了 相当 大 的 灵活 性 。 

从 并 行 计 算 机 系统 体系 结构 来 看 ,阵列 处 理 机 没有 太 好 的 发 展 前 景 , 这 里 就 不 再 对 它 进 
行 更 详细 的 介绍 。 


13.3.2 向 量 处 理 机 


另 一 种 类 型 的 SIMD 计算 机 是 向 量 处 理 机 :向量 处 理 机 在 商业 上 取得 了 很 大 的 成 功 。 
Cray Research 公司 设计 的 系列 计算 机 ,从 1976 年 的 Cray-l 到 后 来 的 C90 和 T90, 在 科学 
计算 领域 占据 了 数 十 年 的 统治 地 位 。 下 面 将 介绍 向 量 处 理 方式 和 向 量 处 理 机 的 基本 原理 。 

典型 的 数值 计算 的 应 用 ,可 以 由 类 似 下 面 这 样 的 语句 组 成 : 

for(i=0;i<N;it+) 

A[i]=B[i]+ C[i] 

这 里 的 A、B 和 C 通常 是 浮 点 数组 成 的 数组 。 该 循环 的 功能 把 数组 B 和 C 的 第 i 个 元 
素 相 加 并 把 结果 保存 在 数组 A 的 第 i 个 元 素 中 。 实 际 上 我 们 可 以 把 数组 A、B、C 看 作 是 长 
度 为 N 的 向 量 (Vectors). 即 

A 一 (aiaz…QaN) 甩 一 (0102…ON)C = 〈(clcz…cN) 

引入 向 量 数据 表示 之 后 .上述 循环 语句 可 以 写成 如 下 向 量 运算 方式 : A 王 B 十 C。 向 量 
运算 可 以 采用 3 种 不 同 处 理 方法 : 横向 处 理 方法 、 纵 向 处 理 方法 和 纵横 处 理 方法 。 现 以 计 
算 表达 式 D 二 AX(B 十 CO) 为 例 进行 说 明 , 其 中 A、B.C、D 都 是 长 度 为 N 的 向 量 。 

横向 处 理 方法 : 向 量 计 算 按 行 的 方式 从 左 至 右 横向 进行 。 

di =aiX (b++a) 
d2 = as X (bs es) 





dn = an X (bntcen) 
即 逐 个 求 向 量 忆 中 个 分 量 : 先进 行 相 加 运算 和 < 一 (bi 十 1) ,ki 为 暂 存 单元 ;然后 进行 
相 乘 运算 di 一 ki Xal。 可 以 看 出 , 当 采 用 流水 方式 计算 时 ,在 每 个 向 量 加 乘 运 算 中 都 会 发 生 
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数据 相关 。 而 且 当 使 用 静态 流水 线 时 ,还 要 进行 2 次 乘 和 加 功能 的 转移 。 这 样 共 出 现 N 次 
相关 和 2N 次 功能 转换 。 因 此 ,横向 处 理 方法 不 适合 于 向 量 流水 处 理 。 
纵向 处 理 方法 : 向 量 计算 是 按 列 的 方式 自 上 而 下 纵向 地 进行 。 
d=aX(h+a)=h 
aa = azs X (bs cs) — ks 





dn =anX (bnt+cn)— ky 

即 先 是 所 有 B 和 C 向 量 元 素 对 的 相 加 运算 ,中 间 结 果 和 暂 存 到 ky~kw 中 ;然后 再 纵向 加 
工 所 有 对 应 元 素 的 乘法 运算 。 用 向 量 指令 形式 来 表示 , 则 变 成 K==B 十 C,D 一 KXA。 显 
然 , 当 采用 流水 方式 计算 时 ,数据 相关 在 两 条 向 量 指令 间 仅 有 1 次 ,而 流水 线 加 、 乘 功能 的 切 
换 只 需 1 次 。 因 此 ,纵向 处 理 方法 可 获得 较 高 的 吞吐 率 , 适 合 于 在 向 量 处 理 机 中 应 用 。 例 如 
存储 器 -存储 器 工作 方式 的 向 量 处 理 机 都 采用 纵向 处 理 方法 。 

纵横 处 理 方法 : 纵横 处 理 方法 是 上 述 两 种 方法 的 结合 ,又 称 为 分 组 处 理 方法 。 组 内 采 
用 纵向 处 理 , 组 间 采 用 横向 处 理 。 假 设 向 量 长 度 为 N, 分 成 S 组 ,每 组 长 度 为 n;r 为 余数 ,也 
作为 一 组 处 理 , 共 S 十 1 组 。 即 N=Sn 十 7, 其 中 ,nN,r<n, 所 有 参数 均 为 正 整数 。 

先 算 第 一 组 : ks 二 Di 十 ci~n 


di~n=a1~n Xki~n 
再 算 第 二 组 : ht1~zn 三 bnt1~2n 十 Cnt1~2n 
CH 光一 


再 继续 第 三 组 ,组 内 仍 采用 纵向 处 理 。 最 后 一 组 (S 十 1) 为 余数 7, 因 x 二 n, 仍 作为 一 组 
来 处 理 。 由 上 可 见 ,每 组 内 各 有 两 条 向 量 指令 。 各 组 内 有 一 次 数据 相关 , 需 2 次 流水 功能 切 
换 , 且 需 个 中 间 向 量 暂 存单 元 。 纵 横 处 理 方法 适合 于 寄存 器 -寄存 器 工作 方式 的 向 量 处 
理 机 。 

图 13. 10 是 一 种 可 行 的 适用 于 向 量 处 理 的 SIMD 体系 结构 。 通 过 执行 向 量 运算 指令 ， 
这 种 计算 机 输入 两 个 具有 N 个 元 素 的 向 量 ,可 以 同时 对 N 个 元 素 进行 操作 的 向 量 ALU 对 
相应 的 元 素 进行 并 行 处 理 , 最 后 产生 一 个 结果 向 量 。 输 入 向 量 和 输出 向 量 可 以 保存 在 内 存 
中 ,也 可 以 保存 在 特殊 的 向 量 寄存 器 里 。 

在 实际 使 用 中 ,很 少 有 超级 计算 机 采用 图 13. 10 的 体系 结构 ,常用 的 方法 是 把 向 量 处 理 
和 流水 线 结合 起 来 ,这 样 能 够 获得 较 好 的 性 能 价格 比 。 需 要 注意 的 是 ,用 于 执行 向 量 操作 的 
流水 线 和 执行 通用 指令 的 流水 线 有 一 个 很 大 的 
不 同 ,在 执行 向 量 操作 时 不 会 遇 到 分 支 跳 转 指 vy 
令 。 也 就 是 几乎 不 会 发 生 数据 相关 和 控制 相关 
问题 ,这 样 每 个 时 钟 周期 都 可 以 充分 利用 。 输入 向 量 

向 量 处 理 机 一 般 具 有 多 个 ALU, 每 个 都 专门 
处 理 某 种 特殊 类 型 的 操作 .所 有 的 ALU 都 可 以 
并 行 执行 。 典 型 的 例子 就 是 早期 的 向 量 超级 计 向 量 运算 器 
算 机 Cray-1, 它 类 似 于 RISC 的 体系 结构 使 它 成 
了 一 个 很 好 的 研究 范例 ,许多 现代 的 向 量 超级 计 
算 机 的 体系 结构 都 受到 它 的 影响 。 图 13.10 用 于 向 量 处 理 的 SIMD 体系 结构 
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虽然 向 量 流 水 处 理 具有 很 多 结构 上 的 特点 ,但 是 要 使 软件 能 够 充分 发 挥 硬 件 所 提供 的 
这 些 特 点 并 不 容易 。 它 必然 要 对 语言 结构 和 编译 程序 提出 新 的 要 求 ,例如 高 级 语言 需要 增 
加 向 量 运算 符 等 。 另 外 ,优化 的 目标 程序 必然 要 和 向 量 流水 机 器 的 具体 结构 特点 密切 相关 ， 
这 也 将 导致 编译 程序 的 设计 复杂 化 。 


13.4 共享 内 存 的 多 处 理 机 系统 


多 处 理 机 系统 是 具有 多 个 CPU., 并 且 所 有 的 CPU 共享 一 个 地 址 空间 的 计算 机 系统 ,如 
图 13.11(a) 所 示 。 多 处 理 机 系统 有 时 也 被 称 为 共享 内 存 系 统 (Shared Memory System)。 
许多 计算 机 厂商 都 提供 多 人 处理 机 系统 ,比如 Sun Enterprise 10000、Sequent NUMA-Q.、SGI 
Origin 2000 和 HP/Convex Exemplar 等 。 
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P 村 P [E27 和 了 
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Pl PllrlPe P|z|pzlP 
(a) 16 个 CPU 共 享 一 个 公共 内 存 的 多 处 理 机 系统 。 (b) 一 个 图 像 分 成 16 块 ， 每 块 都 由 不 同 的 CPU 分 析 








图 13.11 多 处 理 机 设计 方案 


从 软件 的 角度 来 说 ,多 处 理 机 系统 很 容易 扩展 。 多 处 理 机 系统 中 的 所 有 处 理 器 都 共享 
同一 个 映射 到 共享 物理 内 存 上 的 虚拟 地 址 空间 。 任 何 一 个 处 理 器 都 可 以 通过 执行 LOAD 
或 者 STORE 指令 从 内 存 读 一 个 字 或 者 向 内 存 写 人 一 个 字 , 不 需要 附加 任何 其 他 的 操作 。 
两 个 处 理 器 之 间 可 以 通过 很 简单 的 方式 进行 通信 ,只 要 一 个 处 理 器 把 数据 写 人 内 存 而 另 一 
个 处 理 器 从 内 存 中 把 数据 读 出 就 可 以 了 。 

由 于 多 处 理 机 系统 中 ,两 个 或 者 多 个 处 理 器 之 间 可 以 通过 读 写 内 存 进行 通信 ,因此 多 处 
理 机 系统 很 流行 。 这 是 一 种 程序 员 很 容易 理解 的 模型 而 且 可 以 用 于 解决 大 量 的 问题 。 例 
如 ,一 个 程序 需要 检测 一 幅 BMP 图 像 并 列 出 其 中 所 有 的 对 象 。 如 图 13. 11(b) 所 示 ,该 图 像 
被 调和 人 内存 ,16 个 CPU 每 个 都 运行 一 个 单独 的 进程 ,每 个 进程 负责 分 析 图 像 的 1/16。 当 
然 , 每 个 进程 都 可 以 访问 整个 图 像 , 这 一 点 很 重要 ,因为 某 些 对 象 可 能 会 占据 图 像 的 多 个 部 
分 。 如 果 某 个 进程 发 现 某 个 对 象 延伸 到 了 自己 所 处 理 的 部 分 之 外 ,那么 它 可 以 通过 读 相 邻 
部 分 的 图 像 来 继续 自己 的 分 析 。 在 这 个 例子 中 , 某 些 对 象 可 能 会 同时 被 多 个 进程 发 现 ,因此 
需要 做 一 些 协 调 工 作 来 判断 图 中 到 底 有 和 多少 房 子 、 多 少 树 和 多 少 飞机 。 

和 所 有 的 计算 机 系统 一 样 .多 处 理 机 系统 也 必须 有 磁盘 、 网 络 适配器 和 其 他 的 输入 / 输 
出 设备 。 在 某 些 多 处 理 机 系统 中 ,只 有 特定 的 几 个 CPU 才能 访问 输入 /输出 设备 ,因此 也 
就 具有 特殊 的 输入 /输出 函数 。 在 其 他 的 一 些 系统 中 ,每 个 CPU 都 能 平等 地 访问 每 个 输 
入 /输出 设备 。 如 果 在 一 个 系统 中 .每 个 CPU 都 能 平等 地 访问 所 有 的 内 存 模块 和 输入 / 输 
出 设备 ,而 且 在 操作 系统 看 来 这 些 CPU 是 可 以 互 换 的 ,那么 这 种 系统 就 是 对 称 多 处 理 机 系 
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统 (Symmetric MultiProcessor.SMP)。 

多 处 理 器 系统 中 所 有 的 CPU 都 共享 公共 内 存 , 根 据 共享 内 存 的 实现 方式 可 以 把 多 处 
理 器 系统 分 成 3 类 ,分 别 是 一 致 性 内 存 访问 计算 机 、 非 一 致 性 内 存 访问 计算 机 和 基于 Cache 
的 内 存 访问 计算 机 。 之 所 以 这 样 分 类 是 因为 在 大 多 数 多 处 理 器 系统 中 内 存 都 被 分 成 了 多 个 
不 同 的 模块 。UMA 计算 机 的 特点 是 CPU 访问 所 有 的 内 存 模 块 的 时 间 都 相同 。 换 句 话 说， 
读 取 每 个 内 存 字 的 时 间 是 相等 的 。 如 果 在 实现 中 有 困难 ,就 把 速度 快 的 内 存 的 访问 速度 降 
低 以 保证 和 最 慢 的 相等 ,这 样 程序 员 就 不 会 感觉 到 速度 的 差别 了 。 这 就 是 一 致 性 的 含义 。 
这 种 一 致 性 可 以 保证 系统 的 性 能 可 以 预测 ,也 有 利于 程序 员 编 写 高 效率 的 代码 。 和 UMA 
相反 ,在 NUMA 多 处 理 器 系统 中 就 没有 这 种 一 致 性 。 在 NUMA 系统 中 ,靠近 CPU 的 内 存 
模块 的 访问 速度 比 其 他 的 内 存 模块 快 得 多 。 这 样 实现 也 是 出 于 提高 性 能 的 考虑 , 它 主 要 关 
系 到 代码 和 数据 的 位 置 。COMA 计算 机 也 是 不 一 致 的 ,但 是 这 两 种 不 一 致 有 所 区 别 。 后 面 
我 们 会 详细 讨论 这 些 类 型 和 它们 的 子 类 型 。 


13.4.1 一 致 性 内 存 访 问 的 UMA 多 处 理 机 系统 


最 简单 的 UMA 多 处 理 机 系统 是 基于 单 总 线 的 ,如 图 13. 12(a) 所 示 。 两 个 或 者 更 多 的 
CPU 以 及 一 个 或 者 更 多 的 内 存 模块 都 使 用 同一 条 总 线 进 行 通信 。 当 某 个 CPU 需要 读 取 内 
存 时 , 它 首先 检查 总 线 是 否 正 在 被 使 用 。 如 果 此 时 总 线 是 空闲 的 ,CPU 就 把 内 存 地 址 放 在 
总 线 上 ,并 且 在 其 他 一 些 控制 信号 的 配合 下 ,等 待 内 存 把 它 需 要 的 内 存 字 放 在 总 线 上 。 如 果 
当 CPU 需要 读 写 内 存 时 发 现 总 线 正在 被 使 用 ,那么 它 只 有 等 待 直到 总 线 空 闪 。 这 种 设计 
的 主要 问题 是 ,虽然 在 使 用 两 三 个 CPU 情况 下 ,对 总 线 的 争 用 还 是 可 以 管理 的 ,但 是 如 果 
使 用 32 个 或 者 更 多 个 CPU ,对 总 线 的 争 用 就 是 无 法 忍受 的 。 系 统 的 能 力 将 受到 总 线 带宽 
的 限制 ,因为 大 多 数 CPU 在 大 多 数 时间 内 都 处 于 等 待 状态 。 

解决 这 一 问题 的 一 种 方案 是 为 每 个 CPU 都 增加 Cache, 如 图 13. 12(b) 所 示 。Cache 可 
以 在 CPU 芯片 内 部 ,CPU 芯片 的 旁边 或 者 处 理 器 板 上 其 他 位 置 ,也 可 以 把 这 三 者 结合 起 来 
使 用 。 由 于 许多 读 操作 都 可 以 从 Cache 中 获得 数据 ,总 线 的 流量 将 会 少 得 多 ,这 样 不 但 减轻 
了 对 总 线 的 竞争 ,而 且 系统 也 可 以 支持 更 多 的 CPU 。 

在 上 述 方案 之 外 还 有 另 一 种 可 行 的 方案 ,如 图 13. 12(c) 所 示 ,在 这 种 方案 中 ,每 个 CPU 
不 仅 有 自己 的 Cache 而 且 还 有 自己 的 私有 内 存 , 私 有 内 存 是 通过 私有 总 线 进行 访问 的 。 为 
了 能 够 最 佳 地 利用 这 种 体系 结构 ,编译 器 应 该 把 所 有 的 程序 文本 、 字 符 串 、 常 量 和 其 他 的 只 
读数 据 以 及 堆栈 和 局 部 变量 等 放 在 自己 的 私有 内 存 中 。 共 享 内 存 只 用 于 存放 共享 变量 。 在 
大 多 数 情况 下 ,这 种 精心 考虑 的 数据 分 布 可 以 极 大 地 减少 总 线 流量 ,但 是 它 需 要 编译 器 的 主 
动 支持 。 
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(a) 不 使 用 Cache (b) 使 用 Cache (c) 使 用 Cache 和 私有 内 存 


图 13. 12 基于 总 线 结构 的 多 处 理 机 系统 
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我 们 在 前 面 关于 性 能 的 讨论 过 程 中 ,忽略 了 一 个 基本 的 问题 。 例 如 当 CPU 的 Cache 
中 有 一 行 数据 ,而 CPU* 同样 也 想 读 这 个 数据 时 ,如 果 在 没有 任何 特殊 规定 的 情况 下 ,CPU。 
的 Cache 中 也 将 获得 该 数据 的 复制 。 从 原理 上 来 说 ,同一 行 数 据 缓存 两 次 也 是 可 以 的 。 现 
在 假定 CPU 修改 了 这 一 行 数据 ,而 就 在 修改 刚刚 完成 之 后 ,CPU;: 读 取 了 它 自己 的 Cache 
中 的 这 行 数据 。 显 然 ,CPU: 读 到 的 是 过 时 的 数据 ,也 就 会 导致 CPU。 上 运行 的 程序 产生 错 
误 的 结果 。 这 一 严重 的 问题 称 为 Cache 一 致 性 问题 。 如 果 不 想 办 法 解决 这 个 问题 ,Cache 
就 不 能 使 用 ,基于 总 线 的 多 处 理 机 系统 也 就 只 能 使 用 两 三 个 CPU 了 。 认 识 到 问题 的 重要 
性 后 ,人 们 提出 了 多 种 解决 方案 ,也 就 是 所 谓 的 Cache 一 致 性 协议 (Cache Coherence 
Protocols) ,虽然 这 些 协 议 在 细节 上 有 所 不 同 , 但 是 它们 的 目的 都 是 为 了 防止 在 两 个 或 者 更 
多 的 Cache 中 出 现 同 一 行 数据 的 不 同 版 本 。 

在 几乎 所 有 这 些 Cache 一 致 性 协议 中 ,Cache 控制 器 都 被 设计 成 可 以 监听 总 线 , 可 以 监 
听 其 他 CPU 和 Cache 的 所 有 请 求 并 在 某 些 特定 的 情况 下 采取 相应 的 操作 。 正 是 因为 它们 
可 以 监听 总 线 , 这 种 Cache 被 称 为 监听 型 Cache。 由 Cache、CPU 和 内 存 共同 实现 的 防止 多 
个 Cache 中 出 现 相同 数据 的 不 同 版 本 的 规则 集合 就 组 成 了 Cache 一 致 性 协议 。Cache 读 写 
和 保存 的 单元 称 为 Cache 行 ,一 般 是 32 个 字 节 或 者 64 个 字 节 。 

1， 写 直达 Cache 一 致 性 协议 

最 简单 的 Cache 一 致 性 协议 是 写 直 达 协 议 (Write Through Protocol) 。 表 13. 3 中 列 出 
了 监听 型 Cache 按照 此 协议 进行 读 写 操作 时 的 4 种 情况 ,通过 此 表 可 以 很 容易 地 理解 该 协 
议 。 表 中 的 空白 项 表示 不 采取 任何 操作 。 

表 13.3 写 直 达 Cache 一 致 性 协议 





























操作 本 地 请 求 远程 请 求 
读 缺 失 从 内 存 取 数据 
读 命中 使 用 本 地 Cache 的 数据 
写 缺 失 修改 内 存 中 的 数据 
写 命中 修改 Cache 和 内 存 将 Cache 项 置 为 失效 


当 CPU 要 读 的 字 不 在 Cache 中 时 , 即 发 生 了 读 缺 失 ,Cache 控制 器 就 把 包括 该 字 的 一 
行 数据 读 人 Cache。 这 行 数据 是 由 内 存 提 供 的 ,在 该 协议 中 ,内 存 中 的 数据 总 是 最 新 的 。 接 
下 来 的 读 操 作 就 可 以 直接 从 Cache 中 获得 数据 ,也 就 是 读 命中 。 

当 发 生 写 缺 失 时 ,也 就 是 要 写 入 的 字 不 在 Cache 中 , 则 把 被 修改 的 字 写 回 内 存 , 但 是 并 
不 把 包括 该 字 的 行 调和 人 Cache。 当 发 生 写 命中 时 ,也 就 是 要 写 入 的 字 已 经 在 Cache 中 ,修改 
Cache 的 同时 还 要 把 该 字 直 接 写 和 内存。 该 协议 的 要 点 就 在 于 所 有 的 写 操作 都 直接 写 人 内 
存 以 保证 内 存 中 的 数据 总 是 最 新 的 。 

下 面 我 们 再 从 监听 者 的 角度 来 看 一 看 此 协议 中 的 这 些 操作 , 如 表 13. 3 右边 一 列 所 示 。 
假设 共有 两 个 Cache.Cachel 和 监听 的 Cache2。 当 Cachel 读 缺 失 时 , 它 在 总 线 上 发 送 一 个 
从 内 存 中 取 数 据 的 请 求 。Cache2 监听 到 该 动作 ,但 是 没有 做 任何 操作 。 当 Cachel 读 命中 
时 ,总线 上 不 会 发 送 任何 请 求 , 因 此 Cache2 也 就 没有 监听 到 Cachel 发 生 了 读 命中 。 

写 操作 就 和 读 操 作 有 所 不 同 了 , 当 CPU1 执行 写 操作 时 ,在 写 缺 失 和 写 命 中 两 种 情况 
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下 Cachel 都 要 在 总 线 上 发 送 写 请 求 。 无 论 是 哪 种 写 请 求 ,Cache2 都 要 检查 写 入 内 存 的 字 
是 否 在 自己 的 Cache 中 。 如 果 不 在 ,那么 从 Cache2 的 角度 来 看 ,这 就 是 一 个 远程 的 写 缺失 
请 求 因此 不 用 做 任何 操作 。 需 要 注意 的 是 ,在 表 13. 3 中 远程 的 写 缺 失意 味 着 该 字 不 在 监听 
者 的 Cache 中 ; 它 并 不 关心 该 字 是 否 在 写 操作 发 起 者 的 Cache 中 。 因 此 某 个 请 求 可 能 对 本 
地 Cache 来 说 是 命中 而 对 于 监听 者 来 说 是 缺失 ,反之 亦 然 。 

现在 假定 Cachel 写 入 内 存 的 字 也 存在 于 Cache2 中 , 即 发 生 了 远程 请 求 中 的 写 命中 。 
如 果 Cache2 仍然 不 进行 任何 操作 ,那么 相应 的 字 将 变 成 过 时 的 数据 ,所 以 它 需要 在 包括 这 
个 最 新 修改 的 字 的 Cache 行 上 打上 无 效 标记 。 因 为 所 有 的 Cache 都 监视 所 有 的 总 线 请 求 ， 
无 论 何 时 写 和 一 个 字 , 最 后 的 结果 都 是 操作 发 起 者 的 Cache 被 更 新 ,内 存 被 更 新 ,其 他 所 有 
的 Cache 中 的 这 个 字 都 被 设置 为 无 效 。 通 过 这 种 方式 有 效 地 避免 了 不 一 致 性 的 出 现 。 

简单 的 方案 往往 效率 很 低 , 因 为 每 次 写 操作 都 要 通过 总 线 ,只 要 CPU 的 数量 稍微 多 一 
些 , 总 线 就 仍然 成 为 瓶颈 。 为 了 保证 总 线 的 流量 在 一 定 范围 之 内 ,人 们 设计 出 了 其 他 的 
Cache 一 致 性 协议 。 它 们 都 具有 一 个 共同 的 特点 : 写 操作 不 直接 写 和 内存 。 相 反 , 当 Cache 
行 被 修改 后 ,Cache 中 的 某 一 位 被 设置 以 表示 该 Cache 行 中 的 数据 是 正确 的 而 内 存 中 的 数 
据 是 过 时 的 。 当 然 最 终 该 行将 会 被 写 回 内 存 , 但 是 可 能 是 在 多 次 写 操作 之 后 了 。 这 种 类 型 
的 协议 被 称 为 写 回 协议 (Write-back Protocol) 。 

2. 写 回 Cache 一 致 性 协议 

一 种 比较 常用 的 写 回 Cache 一 致 性 协议 是 MESI 协议 , 它 是 用 协议 中 用 到 的 4 种 状态 
的 首 字母 (M,E,S 和 了 来 命名 的 。 它 是 从 早期 的 写 一 次 性 协议 (Write-once Protocol) 发 展 
而 来 的 。 目 前 Pentium 和 许多 其 他 的 CPU 都 使 用 了 MESI 协议 来 监听 总 线 。 在 这 个 协议 
中 每 个 Cache 项 都 处 于 下 面 4 种 状态 之 一 。 

(1) 无 效 (Invalid)。 该 Cache 项 包含 的 数据 无 效 。 

(2) 共享 (Shared) 。 多 个 Cache 项 中 都 有 这 行 数据 ,内 存 中 的 数据 是 最 新 的 。 

(3) 独占 (Exclusive)。 没 有 其 他 的 Cache 项 包括 这 行 数据 ,内 存 中 的 数据 是 最 新 的 。 

(4) 修改 (Modified)。 该 项 的 数据 是 有 效 的 ,但 内 存 中 的 数据 是 无 效 的 ,而 且 在 其 他 
Cache 项 中 没有 该 项 数据 的 拷贝 。 

下 面 我 们 结合 图 13. 13 来 对 MESI Cache 一 致 性 协议 进行 进一步 的 讨论 ,主要 分 析 一 
下 协议 的 工作 过 程 。 

当 CPU 刚刚 启动 的 时 候 . 所 有 的 Cache 项 都 标记 为 无 效 状态 。 第 一 次 读 取 内 存 时 , 读 
入 CPU 的 Cache 的 行 的 状态 被 标记 为 独占 ,因为 此 时 它 是 Cache 中 的 唯一 的 一 份 复制 ,如 
图 13. 13(a) 所 示 ,CPU 读 和 人 了 一 行 数据 A。 接 下 来 CPU, 的 读 操作 都 是 从 Cache 中 取得 
数据 而 不 用 经 过 总 线 了 。 其 他 的 CPU 也 可 以 取 相同 的 数据 行 并 缓存 .但 是 通过 监听 ,最 初 
的 数据 持 有 者 CPU 看 到 这 行 数据 是 自己 已 经 有 的 就 在 总 线 上 发 布 通告 ,宣布 自己 有 一 份 
该 数据 的 复制 。 这 样 ,这 两 个 复制 就 都 被 标记 成 共享 状态 ,如 图 13. 13(b) 所 示 。CPU 对 处 
于 共享 状态 的 Cache 行 的 读 操作 不 使 用 总 线 而 且 也 不 会 产生 状态 改变 。 

如 果 CPU; 向 共享 状态 的 Cache 行 写 人 数据 . 它 同 时 会 把 一 个 无 效 信号 通过 总 线 传 送 
给 其 他 的 CPU ,通知 它们 把 相应 的 数据 复制 置 为 无 效 。 而 CPU。 自己 的 Cache 行 的 状态 则 
变 成 了 修改 状态 ,如 图 13. 13(c) 所 示 。 此 时 ,该 行 并 不 需要 写 回 内 存 。 这 里 需要 注意 的 是 ， 
如 果 处 于 独占 状态 的 Cache 行 发 生 了 写 操作 , 则 不 需要 给 其 他 的 Cache 发 送 无 效 信 号 ,因为 
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其 他 Cache 中 并 不 存在 该 数据 行 的 复制 。 

如 果 CPUs 读 该 行 时 ,拥有 该 行 的 CPU: 知道 内 存 中 的 数据 是 无 效 的 ,因此 CPU: 就 在 
总 线 上 发 送 一 个 信和 号 通知 CPUs 等 待 它 把 该 行 写 回 内 存 。 当 写 回 操作 完成 后 ,CPUs 从 内 
存 中 取得 数据 的 复制 ,然后 把 CPU。 和 CPUs 的 Cache 中 该 行 都 标记 为 共享 ,如 图 13. 13(d) 
所 示 。 在 这 之 后 ,CPU: 再 次 写 该 行 ,这 将 使 CPUs 的 Cache 中 对 应 行 无 效 ,如 图 13. 13(e) 
所 示 。 

最 后 ,CPU' 再 向 该 行 中 写 人 一 个 字 。CPU: 则 将 发 生 写 操作 ,就 在 总 线 上 发 送 一 个 信 
号 通知 CPU'; 等 待 它 把 该 行 写 回 内 存 。 当 写 回 操作 完成 后 ,CPU; 将 自己 Cache 中 的 该 行 
标记 为 无 效 ,因此 它 知道 CPU 将 会 修改 该 行 。 这 时 发 生 的 是 CPU 向 没有 缓存 的 行 中 写 
入 数据 的 情况 。 如 果 使 用 了 写 分 配 策略 ,该 行将 被 读 和 人 CPU 的 Cache 并 标记 为 修改 状态 ， 
如 图 13. 13(f) 所 示 。 如 果 没有 使 用 写 分 配 策略 ,将 直接 对 内 存 执行 写 操作 ,而 且 该 行 不 会 
被 读 入 到 任何 Cache 中 。 
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图 13.13 MESI 写 回 Cache 一致 性 协议 


3. 交叉 开关 和 多 级 交换 网 络 

由 于 总 线 带 宽 的 限制 ,基于 总 线 的 UMA 系统 最 多 也 就 能 使 用 16 个 或 者 32 个 CPU。 
为 了 使 用 更 多 的 CPU ,就 需要 采取 其 他 形式 的 互联 网 络 。 比 较 常 用 的 有 两 种 方式 ,一 种 是 
使 用 交叉 开关 , 另 一 种 则 是 使 用 多 级 交换 网 络 。 下 面 分 别 对 这 两 种 方式 进行 简单 介绍 。 

连接 nn 个 CPU 和 个 内 存 模块 的 最 简单 的 电路 就 是 交叉 开关 (Crossbar Switch) ,如 
图 13. 14 所 示 。 交 叉 开 关 技 术 在 电话 交换 机 中 已 经 使 用 了 数 十 年 了 , 它 可 以 按照 任意 的 次 
序 把 输入 线路 和 输出 线路 连接 起 来 。 

如 图 13. 14 所 示 , 交 叉 开 关中 的 每 条 水 平 线 和 垂直 线 的 交点 都 是 一 个 交叉 点 
(Crosspoint) 。 一 个 交叉 点 就 是 一 个 小 的 交换 结 点 , 它 的 电路 状态 可 以 是 打开 或 者 关闭 , 具 
体 状态 取决 于 垂直 线 和 水 平 线 是 否 处 于 连接 状态 。 在 图 13. 14 中 可 以 看 到 有 3 个 交叉 点 同 
时 关闭 ,这 就 同时 建立 了 3 个 CPU 和 内 存 的 连接 。 

交叉 开关 网 络 是 一 种 无 阻塞 的 网 络 (Nonlocking Network) ,这 是 它 最 好 的 一 个 特性 ,这 
就 意味 着 CPU 不 会 因为 某 些 交叉 点 或 者 线路 被 占用 而 无 法 与 内 存 模块 建立 连接 。 而 且 ， 
建立 连接 时 不 需要 事先 规划 。 对 于 图 13.14 中 的 交叉 开关 而 言 , 即 使 已 经 建立 了 7 个 任意 
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图 13.14 8X8 的 交叉 开关 


的 连接 ,仍然 有 可 能 在 剩 下 的 CPU 和 剩 下 的 内 存 之 间 建 立 连接 。 

交叉 开关 也 是 存在 缺点 的 ,一 个 nXn 的 交叉 开关 有 个 交叉 点 。 如 果 需 要 使 用 1000 
个 CPU 和 1000 个 内 存 模块 ,那么 就 需要 100 万 个 交叉 点 。 这 么 多 的 交叉 点 是 不 可 能 实现 
的 。 当 然 , 对 于 中 等 规模 的 系统 ,交叉 开关 设计 是 可 行 的 。 

如 果 想 使 用 比 64 更 多 的 CPU ,那么 可 能 需要 采取 不 同 的 策略 。 这 个 策略 就 是 使 用 多 
级 交换 网 络 。 我 们 首先 介绍 一 个 2X2 的 小 交换 结 点 ,如 图 13. 15 所 示 。 该 交换 结 点 具有 两 
个 输入 和 两 个 输出 。 从 任意 输入 线 到 达 的 消息 都 可 以 交换 到 任意 的 输出 线 ,消息 可 以 包括 
以 下 4 个 部 分 。 
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图 13.15 2X2 的 交换 结 点 和 消息 格式 


(1) 模块 字段 指出 使 用 哪个 内 存 模块 。 

(2) 地 址 定义 了 模块 内 的 地 址 。 

(3) 操作 码 指定 操作 ,比如 READ 或 者 WRITE。 

(4) 可 选 的 值 字段 可 以 包括 一 个 操作 数 ,例如 WRITE 操作 要 写 入 的 32 位 字 。 

交换 结 点 检查 Module 字段 以 判断 消息 应 该 通过 X 传递 还 是 通过 Y 传递 。 

如 图 13. 16 所 示 使 用 了 12 个 交换 结 点 连接 了 8 个 CPU 和 8 个 内 存 模块 。 一 般 来 说 ， 
如 果 有 7 个 CPU 和 个 内 存 模块 .就 需要 1logzn 级 .每 级 n/2 个 交换 结 点 ,一 共 是 (1m/2)log; 
7 个 交换 结 点 ,这 要 比 前 面 所 说 采用 交叉 开关 方式 中 需要 x 个 交叉 点 的 情况 好 多 了 ,尤其 当 
nn 比较 大 时 更 是 如 此 。 

可 以 采用 2X2 的 交换 结 点 组 成 比较 大 的 多 种 不 同形 式 的 多 级 交换 网 络 (Multistage 
Switching Networks)。Omega 网 络 就 是 其 中 比较 经 济 实用 的 一 种 多 级 交换 网 络 .Omega 
网 络 采 用 被 称 为 全 混 洗 (Perfect Shuffle) 的 配 线 模式 , 即 它 的 每 级 开关 输入 线 与 上 一 级 开关 
输出 线 是 均匀 洗 牌 的 连接 方式 。 在 这 种 连接 方式 中 ,就 像 洗 扑 克 牌 一 样 .全 副 牌 分 成 两 半 ， 
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再 将 两 部 分 牌 依 序 交错 插入 。 如 果 用 互 连 函 数 (让 表示 这 种 连接 关系 的 话 , 则 7 太 iD 一 
{zn-2Tn-3""*T1T0XTn-1)， 即 左 端 的 二 进 制 端 号 循环 左 移 1 位 ,就 是 连 线 右 端的 二 进 制 端 号 。 
此 外 ,还 有 其 他 多 种 洗 牌 方式 。 
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图 13. 16 ”Omega 多 级 交换 网 络 


为 了 理解 Omega 网 络 的 工作 原理 ,下 面 举 一 个 例子 进行 说 明 。 例 如 在 图 13. 16 所 示 的 
Omega 多 级 交换 网 络 中 ,CPU 011 需要 从 内 存 模块 110 中 读 取 一 个 字 。 该 CPU 将 发 送 一 
条 模块 字段 为 110 的 读 消息 给 交换 结 点 1D。 交 换 结 点 1D 取出 110 最 左面 的 位 来 确定 如 何 
传送 这 条 消息 。 如 果 是 0 就 从 上 面 的 输出 线 输出 ,如 果 是 1 就 从 下 面 的 输出 线 输出 。 由 于 
110 最 左面 是 1, 这 条 消息 将 传递 给 2D。 包 括 2D 在 内 的 所 有 第 二 级 交换 结 点 都 使 用 第 二 位 
来 确定 如 何 发 送 消息 。 因 为 110 的 第 二 位 还 是 1, 因 此 这 条 消息 将 发 送 给 3D。3D 继续 使 用 
第 三 位 来 决定 消息 发 送 的 方向 ,第 三 位 是 0。 因 此 ,该 消息 将 从 3D 的 上 输出 线 输出 到 达 内 
存 模块 110。 这 条 消息 通过 的 路 径 在 图 13. 16 中 用 字母 a 表示 。 

如 果 两 个 内 存 访问 请 求 使 用 的 交换 结 点 、 链 路 和 内 存 模 块 都 不 相同 ,那么 它们 是 可 以 并 
行 执行 的 。 但 是 Omega 网 络 是 有 阻塞 的 网 络 (Blocking Network)。 在 Omega 网 络 中 并 非 
所 有 的 请 求 都 可 以 同步 执行 , 当 需 要 使 用 同一 条 链 路 或 者 同一 个 交换 结 点 ,或 者 请 求 访问 同 
一 个 内 存 模块 时 都 会 发 生 冲 突 。 


13.4.2 非 一 致 性 内 存 访问 的 NUMA 多 处 理 机 系统 


从 上 述 的 介绍 可 以 知道 ,基于 单 总 线 的 UMA 多 处 理 机 系统 的 CPU 数量 最 多 也 就 几 十 
个 :而 基于 交叉 开关 或 者 多 级 交换 网 络 的 UMA 多 处 理 机 系统 需要 大 量 昂贵 的 硬件 ,而 且 它 
们 的 CPU 数量 也 不 可 能 太 多 。 为 了 构造 超过 100 个 CPU 的 多 处 理 机 系统 ,容易 想到 的 一 
种 思想 就 是 放弃 "所 有 的 内 存 模 块 都 有 一 致 的 访问 时 间 ” 的 限制 ,这 一 让 步 就 产生 了 非 一 致 
性 内 存 访问 NUMA 多 人 处理 机 系统 。 

和 UMA 系统 一 样 ,:NUMA 系统 也 为 所 有 的 CPU 提供 了 单一 的 地 址 空间 ,但 是 和 
UMA 不 一 样 的 是 .在 NUMA 系统 中 访问 本 地 内 存 模 块 比 访问 远程 内 存 模块 速度 快 。 
此 ,所 有 为 UMA 计算 机 编写 的 程序 都 可 以 不 加 修改 地 在 NUMA 计算 机 上 运行 ,但 是 在 相 
同 的 时 钟 频率 下 ,性 能 将 低 于 UMA 计算 机 。NUMA 计算 机 有 3 个 区 别 于 其 他 的 多 处 理 机 
系统 的 关键 的 特点 。 
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(1) 所 有 的 CPU 都 看 到 一 个 单一 的 地 址 空间 。 

(2) 使 用 LOAD 和 STORE 指令 访问 远程 内 存 。 

(3) 访问 远程 内 存 比 访问 本 地 内 存 慢 。 

没有 使 用 Cache 的 NUMA 系统 被 称 为 NCCNUMA, 也 就 是 说 这 种 系统 中 不 隐藏 远程 
内 存 的 访问 时 间 。 如 果 使 用 了 Cache, 那 么 系统 就 被 称 为 CC-NUMA。 

图 13. 17 所 示 的 是 一 种 基于 两 级 总 线 的 NUMA 计算 机 。 它 由 一 组 CPU 组 成 ,每 块 
CPU 都 有 可 以 通过 局 部 总 线 访问 的 内 存 模块 ,各 个 结 点 之 间 通 过 系统 总 线 相 连 。 当 一 个 内 
存 访 问 请 求 进 入 内 存 管理 单元 MMU 之 后 ,MMU 将 检查 请 求 访问 的 字 是 否 在 本 地 内 存 中 。 
如 果 是 ,请 求 将 通过 局 部 总 线 发 送 到 本 地 内 存 去 读 取 该 字 。 如 果 不 是 ,请 求 将 通过 系统 总 线 
发 往 拥有 该 字 的 模块 ,然后 由 拥有 该 字 的 模块 发 回响 应 信息 。 显 然 ,后 者 所 花费 的 时 间 肯 定 
比 前 者 长 。 当 一 个 程序 在 远程 内 存 上 运行 时 , 它 将 比 在 本 地 内 存 上 运行 的 相同 的 程序 多 花 
10 倍 的 时 间 。 

CPU 内 存 CPU ”内 存 CPU 内存 CPU ”内存 
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系统 总 线 
图 13.17 基于 两 级 总 线 的 NUMA 计算 机 
































在 NC-NUMA 系统 中 ,因为 没有 使 用 Cache, 所 以 内 存 的 一 致 性 是 有 保证 的 。 每 个 内 
存 字 都 只 在 一 个 地 点 存在 ,因此 不 存在 包含 陈旧 数据 的 复制 的 问题 。 然 而 ,哪个 页 面 位 于 哪 
个 内 存 模块 中 是 很 重要 的 ,如 果 内 存 页 面 在 错误 的 位 置 上 ,那么 性 能 的 损失 将 相当 大 。 因 
此 ,NC-NUMA 使 用 了 精心 设计 的 软件 来 移动 页 面 以 使 性 能 达到 最 佳 。 

图 13. 17 所 示 的 多 处 理 机 系统 因为 它们 没有 使 用 Cache, 所 以 这 样 的 系统 可 扩展 性 很 
差 。 每 次 使 用 非 本 地 内 存 中 的 字 都 要 去 访问 远程 内 存 将 严重 地 影响 性 能 。 但 是 ,如 果 使 用 
了 Cache, 就 必须 保证 Cache 的 一 致 性 。 保 证 Cache 一 致 性 的 一 种 办 法 是 监听 系统 总 线 , 但 
是 这 种 方法 不 适合 于 建造 大 型 的 多 处 理 机 系统 ,例如 在 多 级 网 络 上 实现 广播 功能 的 代价 很 
大 ,所 以 监听 协议 就 无 法 使 用 。 把 使 其 他 数据 块 无 效 的 一 致 性 命令 只 发 给 存放 相应 数据 块 
的 Cache 是 一 个 很 好 的 解决 办 法 ,这 就 产生 了 一 种 完全 不 同 的 新 策略 , 即 基 于 目录 
(Directory Based) 的 Cache 一 致 性 协议 。 图 13. 18 给 出 了 一 个 具有 256 个 结 点 的 基于 目录 
的 多 处 理 机 系统 示意 图 。 
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图 13. 18 256 个 结 点 的 基于 目录 的 多 处 理 机 系统 


目前 建造 大 型 的 CC-NUMA 多 处 理 机 系统 最 常用 的 策略 是 基于 目录 的 多 处 理 机 系统 。 
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其 主要 设计 思想 是 维护 一 个 数据 库 记 录 内 存 每 个 Cache 行 在 什么 位 置 上 以 及 状态 是 什么 。 
当 某 个 Cache 行 被 访问 时 ,将 查询 该 目录 数据 库 找 到 该 Cache 行 的 位 置 以 及 该 行 是 干净 的 
还 是 脏 的 (也 就 是 被 修改 过 的 )。 由 于 每 条 访问 内 存 的 指令 都 要 查询 这 个 数据 库 , 因 此 这 个 
数据 库 必须 保存 在 速度 非常 快 的 特定 硬件 中 以 保证 能 够 在 不 到 一 个 总 线 周 期 的 时 间 内 做 出 
响应 。 


13.4.3 基于 Cache 内 存 访问 的 COMA 多 处 理 机 系统 


NUMA 和 CC-NUMA 计算 机 有 相同 的 缺点 ,它们 访问 远程 的 内 存 比 访问 本 地 内 存 速 
度 慢 。 在 CC-NUMA 计算 机 中 ,通过 使 用 Cache 在 某 种 程度 上 隐藏 了 这 种 性 能 的 差别 。 无 
论 怎 样 ,如 果 需 要 使 用 的 远程 数据 超过 了 Cache 的 能 力 ,Cache 不 命中 的 情况 将 会 频繁 出 
现 , 性 能 也 会 急剧 下 降 。 

因此 我 们 面 对 的 情况 是 UMA 计算 机 性 能 很 好 但 是 规模 受到 一 定 的 限制 ,而 且 价 格 昂 
贵 。NC-NUMA 计算 机 可 扩展 性 较 好 ,但 是 需要 手动 或 者 半自动 地 放置 页 面 ,通常 使 用 混 
合 型 。 问 题 在 于 很 难 预测 需要 使 用 的 页 面 的 位 置 ,而 且 在 任何 一 种 情况 下 ,页 面 作为 一 个 移 
动 的 单元 来 说 都 太 大 了 。CC-NUMA 计算 机 ,例如 Sun Fire E25K, 当 许多 CPU 都 需要 大 
量 的 远程 数据 时 ,性 能 将 会 变 得 很 差 。 总 而 言 之 ,每 种 设计 方案 都 有 很 大 的 局 限 性 。 

另 一 种 类 型 的 多 处 理 器 系统 试图 通过 把 每 个 CPU 的 主 存 作 为 Cache 来 解决 这 些 问 题 。 
在 这 种 称 为 COMA 的 多 处 理 器 系统 中 ,页 面 并 不 像 NUMA 和 CC-NUMA 计算 机 中 的 页 
面 那样 固定 在 宿主 计算 机 中 。 

在 COMA 系统 中 ,物理 地 址 空间 被 划分 成 Cache 块 ,这 些 块根 据 需要 在 系统 中 来 回 移 
动 。Cache 块 不 再 有 宿主 计算 机 了 。 只 存放 需要 的 块 的 内 存 称 为 吸引 内 存 。 把 主 存 作 为 一 
个 大 的 Cache 可 以 极 大 地 提高 命中 率 , 从 而 提高 性 能 。 

COMA 系统 存在 两 个 新 的 问题 ,第 一 个 问题 是 如 何 对 Cache 块 进行 定位 ;第 二 个 问题 
是 当 需 要 把 某 块 从 内 存 中 清除 掉 时 ,如 果 该 块 是 最 后 一 个 复制 如 何 处 理 。 要 想 使 COMA 
有 效 地 工作 ,必须 要 解决 这 两 个 问题 。 目 前 已 经 有 多 种 不 同 的 方案 ,读者 可 以 阅读 一 些 相关 
的 参考 资料 。 


13.5 基于 消息 传递 的 多 计算 机 系统 


通过 前 面 介绍 的 多 处 理 机 系统 可 以 看 到 ,从 操作 系统 角度 来 看 ,多 处 理 机 系统 提供 了 能 
够 使 用 通常 的 LOAD 和 STORE 指令 存 取 的 共享 内 存 。 而 且 这 种 共享 内 存 可 以 用 多 种 方 
式 实现 ,包括 监听 总 线 、 数 据 交 又 开关、 多 级 交换 网 络 和 各 种 基于 目录 的 机 制 。 无 论 采用 何 
种 机 制 ,为 多 处 理 机 系统 编写 的 程序 可 以 访问 内 存 的 任何 位 置 而 不 用 知道 内 存 的 内 部 拓扑 
结构 和 实现 机 制 。 这 也 是 多 处 理 机 系统 的 优点 所 在 。 

然而 多 处 理 机 系统 也 有 它 自身 的 限制 。 首 先 而 且 最 重要 的 一 点 是 多 处 理 机 系统 很 难 扩 
展 到 很 大 的 规模 。 例 如 Sun 使 用 了 大 量 的 硬件 才 使 Enterprise 10000 扩展 到 了 64 个 CPU。 
Sequent NUMA-Q 可 以 扩展 到 356 个 CPU. 但 是 它 是 以 不 一 致 的 内 存 访问 时 间 为 代价 的 。 
另外 ,多 处 理 机 系统 中 的 内 存 争 用 对 性 能 的 影响 很 大 。 如 果 100 个 CPU 经 常 读 写 同一 个 变 
量 ,那么 对 内 存 模 块 、 总 线 和 目录 的 争 用 将 使 性 能 受到 很 大 的 影响 。 


并行 计算 机 体系 结构 


我 们 在 本 章 开 始 的 时 候 已 经 提 到 了 MIMD 并 行 处 理 器 系统 的 另 一 类 , 即 多 计算 机 系 
统 。 这 类 系统 能 够 使 用 2048 甚至 9416 个 CPU。 也 许 经 过 若干 年 的 努力 ,人 们 或 许可 以 造 
出 10000 个 结 点 的 商用 多 处 理 机 系统 ,但 是 到 那 时 候 , 人 们 已 经 可 以 使 用 100000 结 点 的 多 
计算 机 系统 了 。 

在 多 计算 机 体系 结构 中 ,每 个 CPU 都 有 自己 的 私有 内 存 , 私 有 内 存 只 能 供 自 己 使 用 而 
其 他 的 CPU 则 不 能 访问 。 这 种 体系 结构 有 时 也 被 称 为 分 布 式 内 存 系统 (Distributed 
Memory System) ,如 图 13. 19(a) 所 示 。 也 就 是 说 ,多 处 理 机 系统 所 有 的 CPU 共享 一 个 单 
一 的 物理 地 址 空间 ,而 在 多 计算 机 系统 中 ,每 个 CPU 都 有 自己 独立 的 物理 地 址 空间 。 

由 于 多 计算 机 系统 中 的 CPU 不 能 通过 读 写 共享 内 存 进行 通信 ,它们 需要 另 一 种 不 同 
的 通信 机 制 。 在 多 计算 机 系统 中 ,通信 是 通过 使 用 互联 网 络 传递 消息 来 实现 的 。 多 计算 机 
的 例子 包括 IBM BlueGene/L、Red Storm 和 Google 集群 等 。 


















































































































































































































































M] M] M] M|- 私 有 内 存 -| | 全 
PTPTeTPceu PPTPJP| -cpu 
MH PTH PHM HP PH 
M JIP | 基于 消息 传递 [了 M | 上代 于 消息 传递 LP 夸 | 
M|| | 的 互联 网 络 | 了 | Hf 的 互联 网 络 | 到 
MHPh PHM™ FHPr P| 
plplele [r llr [fe le 
站 风 硬 | 夯 加 
(a) 16 个 CPU 的 多 计算 机 系统 (每 个 CPU 都 有 私有 内 存 ) (b) 图 13.1 中 的 图 像 分 布 在 16 块 内 存 中 





图 13. 19 多 计算 机 设计 方案 


多 计算 机 系统 中 没有 硬件 实现 的 共享 内 存 这 一 特点 也 在 很 大 程度 上 影响 了 其 软件 体系 
结构 。 多 处 理 机 系统 中 多 个 处 理 器 共享 一 个 单一 的 地 址 空间 ,所 有 的 处 理 器 都 可 以 通过 执 
行 LOAD 和 STORE 指令 来 访问 所 有 的 内 存 ,而 这 一 点 在 多 计算 机 系统 中 是 不 可 能 做 到 
的 。 举 例 来 说 ,如 果 图 13.11(b) 中 的 CPU。 (最 上 面 一 排 左 手 第 一 个 CPU) 发 现 它 分 析 的 图 
像 中 的 对 象 扩展 到 了 分 配给 CPU 的 图 像 中 , 它 就 可 以 继续 读 内 存 来 访问 CPU 。 然 而 如 
果 图 13. 19(b) 中 的 CPU。 也 有 同样 的 发 现 , 它 就 不 能 直接 读 CPU, 的 内 存 , 在 如 何 获取 需 
要 的 数据 方面 ,这 两 种 体系 结构 之 间 存 在 着 很 大 的 不 同 。 

在 多 计算 机 系统 中 ,如 果 一 个 CPU 发 现 某 个 其 他 的 CPU 那里 有 它 需 要 的 数据 , 它 就 
给 该 CPU 发 送 一 条 请 求 获得 数据 的 消息 。 一 般 来 说 ,发 请 求 消息 的 CPU 将 阻塞 (也 就 是 
等 待 ) 直到 请 求 被 响应 。 在 上 面 的 例子 中 , 当 消 息 到 达 CPU 后 ,CPU 的 软件 将 分 析 该 消 
息 并 把 需要 的 数据 发 送 回来 。 当 响应 消息 到 达 CPU 后 ,软件 将 解除 阻塞 并 继续 执行 。 

在 多 计算 机 系统 中 ,进程 间 通 信 通 常 使 用 Send 和 Receive 这 样 的 软件 原 语 。 因 此 ,多 
计算 机 系统 中 的 软件 结构 就 和 多 处 理 机 系统 不 同 .而 且 比 多 处 理 机 系统 复杂 得 多 ,这 同时 也 
就 导致 了 多 计算 机 系统 的 编程 比 多 处 理 机 系统 的 编程 要 复杂 得 多 。 

那么 ,为 什么 不 都 采用 容易 编程 的 多 处 理 机 系统 ,还 要 去 设计 多 计算 机 系统 呢 ? 答案 很 
简单 ,就 相同 数量 的 CPU 来 说 ,大 规模 的 多 计算 机 系统 比 多 处 理 机 系统 结构 简单 而 且 造价 
便宜 。 实 现 一 台 具 有 数 百 个 CPU 的 共享 内 存 的 计算 机 是 一 项 很 复杂 的 工作 ,而 建造 一 台 
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具有 10000 个 或 者 更 多 的 CPU 的 多 计算 机 系统 则 相对 而 言 是 一 项 比较 简单 的 工作 。 

多 计算 机 系统 中 的 每 个 结 点 都 由 一 个 或 者 多 个 CPU、RAM.、 磁 盘 以 及 其 他 的 输入 / 输 
出 设备 和 通信 处 理 器 组 成 。 通 信人 处理 器 通过 互联 网 络 相 互 连 接 起 来 。 可 以 使 用 多 种 不 同 的 
拓扑 结构 交换 策略 和 寻 径 算法 。 所 有 的 多 计算 机 系统 的 一 个 共同 的 特点 是 当 应 用 程序 执 
行 Send 原 语 时 ,系统 就 会 通知 通信 处 理 器 把 一 块 用 户 数据 传递 到 目的 计算 机 中 。 图 13. 20 
是 多 计算 机 系统 的 通用 结构 。 
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图 13. 20 通用 多 计算 机 体系 结构 


多 计算 机 系统 有 各 种 不 同 的 规模 ,因此 对 它们 进行 清晰 的 分 类 是 比较 困难 的 。 但 是 一 
般 来 说 ,可 以 把 多 计算 机 系统 分 成 两 大 类 : MPP 和 COW。 下 面 我 们 来 依次 介绍 这 两 种 
系统 。 


13.5.1 大 规模 并 行 处 理 机 


第 一 类 多 计算 机 系统 是 大 规模 并 行 处 理 系 统 (Massively Parallel Processors, MPP). 它 
们 被 用 于 科学 计算 .工程 计算 和 其 他 需要 大 量 计算 的 工业 部 门 ,每 秒 可 以 处 理 大 量 的 事务 ， 
还 可 以 用 于 数据 仓库 等 ,这 是 一 种 价值 数 百 万 美元 的 超级 计算 机 系统 。 最 初 ,MPP 主要 用 
于 科学 计算 领域 ,现在 它们 大 多 数 都 用 于 商务 环境 。 在 很 大 程度 上 说 ,MPP 系统 取代 了 
SIMD 计算 机 (向 量 超级 计算 机 和 阵列 处 理 机 ) 原 来 的 位 置 。 

大 多 数 的 MPP 系统 都 使 用 标准 的 商用 CPU 作为 它们 的 处 理 器 。 比 较 常 用 的 有 Intel 
公司 的 Pentium 系列 .Sun 公司 的 UltraSPARC 和 IBM 公司 的 PowerPC。 一 般 来 说 , MPP 
系统 具有 以 下 几 个 特点 。 

首先 ,MPP 系统 使 用 了 高 性 能 的 私 用 的 互联 网 络 , 可 以 在 低 延 时 和 高 带宽 的 条 件 下 传 
递 消息 ,这 很 重要 ,因为 大 部 分 信息 都 很 小 (通常 小 于 256 个 字 节 ), 但 是 大 部 分 的 流量 是 来 
自 于 比较 大 的 消息 (超过 8KB)。MPP 系统 还 需要 使 用 大 量 定制 的 软件 和 库 。 

其 次 ,MPP 系统 具有 强大 的 输入 /输出 能 力 。 需 要 使 用 MPP 解决 的 问题 往往 要 处 理 大 
量 的 数据 ,常常 会 达到 太 字 节 。 这 些 数据 必须 分 布 在 多 个 磁盘 上 而 且 需 要 在 结 点 之 间 以 很 
高 的 速率 传递 。 

最 后 ,MPP 系统 能 够 进行 特殊 的 容错 处 理 。 在 使 用 数 千 个 CPU 的 情况 下 ,每 星期 有 若 
干 个 CPU 失效 是 不 可 避免 的 。 但 是 如 果 因 为 一 个 CPU 崩溃 导致 一 个 运行 了 18 个 小 时 的 
任务 被 取消 是 无 法 接受 的 ,尤其 是 当 这 种 情况 每 周 都 会 出 现时 。 因 此 大 规模 的 MPP 系统 
总 是 使 用 特殊 的 硬件 和 软件 来 监控 系统 ,监测 错误 并 从 错误 中 平滑 地 恢复 。 

MPP 的 一 般 设计 原理 比较 简单 而 且 容易 理解 ,其实 MPP 就 是 由 快速 的 互联 网 络 连接 
起 来 的 比较 标准 的 计算 结 点 的 组 合 。 








并行 计算 机 体系 结构 


13.5.2 工作 站 集群 


工作 站 集群 (Clusters Of Workstations.COW) 是 男 一 种 多 计算 机 系统 , 它 也 被 称 为 工 
作 站 网 络 (Network Of Workstations, NOW)。 一 般 来 说 ,COW 系统 是 由 数 百 台 PC 或 者 工 
作 站 通过 商用 网 络 连接 在 一 起 构成 的 。 

从 体系 结构 上 讲 ,COW 有 两 点 和 MPP 不 同 。 第 一 ,COW 的 结 点 是 更 完整 的 计算 机 ， 
计算 机 可 以 是 同 构 的 也 可 以 是 异 构 的 。 结 点 都 有 自己 的 磁盘 , 驻 留 有 自己 的 操作 系统 ;并 
且 , 一 般 都 有 一 定 的 自主 性 。 结 点 计算 机 脱离 COW 照样 能 运行 。 第 二 ,MPP 使 用 制造 厂 
商 专 有 (或 者 说 是 有 专利 权 ) 的 高 速 通信 网 络 ;COW 一 般 采 用 公开 销售 的 标准 高 速 局 域 网 
或 系统 域 网 ,网 络 通常 是 与 结 点 计算 机 的 IO 总线 相连 。 

技术 是 COW 发 展 的 推动 力量 。MPP 系统 中 使 用 的 CPU 就 是 商用 的 CPU ,这 些 商用 
的 CPU 包括 Alpha 系列 .Pentium 系列 等 ,任何 人 都 可 以 买 到 。 它 们 使 用 的 DRAM 也 很 常 
用 ,而 且 运 行 的 是 UNIX 操作 系统 。 总 而 言 之 ,在 这 些 方面 COW 和 MPP 没有 什么 区 别 。 
MPP 中 的 特殊 部 分 在 于 它 的 高 速 互联 网 络 ,但 是 现在 商用 的 高 速 互联 网 络 也 已 经 开始 出 
现 。COW 和 MPP 相 比 ,优势 在 于 COW 可 以 完全 使 用 可 以 买 到 的 商用 组 件 装配 而 成 ,这 些 
商用 组 件 都 是 大 规模 生产 的 产品 ,因此 能 够 获得 较 高 的 性 价 比 。 而 且 由 于 存在 市 场 竞 争 ,这 
些 组 件 的 性 价 比 还 在 不 断 提高 .所 以 COW 有 可 能 取代 MPP 系统 的 位 置 。 

COW 系统 有 许多 种 ,其 中 占 主导 地 位 的 主要 有 两 种 : 集中 式 的 和 分 散 式 的 。 集 中 式 的 
COW 是 装 在 一 个 大 机 架 上 的 工作 站 或 者 PC 的 集群 。 有 时 候 它 们 排列 的 很 紧密 以 节省 物 
理 空间 和 光纤 长 度 。 一 般 来 说 ,这 些 计 算 机 的 种 类 都 是 相同 的 ,而 且 除 了 网 卡 和 磁盘 之 外 没 
有 其 他 的 外 设 。 分 散 式 的 COW 是 由 分 布 在 一 座 大 楼 或 者 校园 里 的 工作 站 或 者 PC 组 成 的 ， 
通常 它们 是 通过 局 域 网 连接 的 。 一 般 来 说 ,这 些 计 算 机 的 种 类 是 不 同 的 ,而 且 有 丰富 的 外 
设 。 最 重要 的 是 ,这 些 计算 机 属于 不 同 的 所 有 者 ,只 能 在 这 些 计算 机 空闲 的 时 候 并 且 所 有 者 
同意 的 情况 下 其 他 用 户 才 能 使 用 它们 。 使 用 空闲 的 工作 站 组 成 COW 意味 着 当 计 算 机 的 所 
有 者 要 求 回 收 他 们 的 计算 机 时 ,要 把 正在 运行 的 任务 在 不 同 的 计算 机 之 间 转 移 。 任 务 转移 
是 可 以 实现 的 但 是 会 增加 软件 的 复杂 性 。 


本 章 内 容 小 结 和 学 习 方法 建议 


并 行 计算 机 系统 可 以 分 成 两 大 类 : SIMD 系统 和 MIMD 系统 。SIMD 计算 机 可 以 同时 
在 多 个 数据 集 上 并 行 执行 同一 条 指令 。 这 种 类 型 的 计算 机 包括 阵列 处 理 器 系统 和 向 量 处 理 
机 。MIMD 计算 机 在 并 行 计算 领域 占有 统治 地 位 , 它 可 以 同时 在 不 同 的 结 点 计算 机 上 运行 
不 同 的 程序 。MIMD 计算 机 可 以 分 成 多 处 理 机 系统 和 多 计算 机 系统 两 大 类 ,多 处 理 机 系统 
共享 物理 内 存 ,而 多 计算 机 系统 中 物理 内 存 是 不 被 共享 的 。 无 论 是 多 处 理 机 系统 还 是 多 计 
算 机 系统 ,都 通过 不 同 的 高 速 互联 网 络 把 一 大 批 CPU 和 内 存 模块 连接 起 来 。 

设计 并 行 计 算 机 的 目的 就 是 使 它 的 处 理 能 力 比 单 处 理 器 的 计算 机 更 强 。 并 行 计 算 机 体 
系 结构 的 性 能 问题 主要 涉及 硬件 和 软件 性 能 指标 ,以 及 如 何 获得 更 高 的 性 能 等 方面 。 软 件 
问题 在 讨论 并 行 计 算 机 体系 结构 的 时 候 也 是 非常 重要 的 ,如 果 没 有 并 行 软件 ,并 行 硬件 基本 
上 就 没有 什么 用 处 。 
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因为 在 大 多 数 多 处 理 机 系统 中 内 存 都 被 分 成 了 多 个 不 同 的 模块 ,所 以 根据 共享 内 存 的 
模块 组 织 方式 ,可 以 把 多 处 理 机 系统 分 成 3 类 ,分 别 是 一 致 性 内 存 访问 计算 机 (UMA), 非 一 
致 性 内 存 访问 计算 机 (NUMA) 和 基于 Cache 内 存 访问 计算 机 (COMA)。 而 多 计算 机 系统 
可 以 粗略 地 分 成 MPP 系统 和 COW 系统 ,它们 的 界限 有 时 也 很 模糊 。MPP 是 高 度 商业 化 
的 系统 ,它们 都 使 用 专用 的 高 速 互联 网 络 .COW 则 是 建立 在 商用 组 件 基础 上 的 。 

应 该 说 这 一 章 所 提供 的 是 计算 机 系统 结构 课程 的 核心 内 容 , 学 起 来 会 感到 有 点 难度 , 强 
调 建 立 起 并 行 计算 机 系统 的 基础 概念 ,通过 构建 大 型 .超大 型 的 计算 机 系统 提高 计算 机 处 理 
能 力 的 多 种 可 行 方案 ,还 必须 从 硬件 .软件 两 个 方面 来 解决 问题 。 


习题 与 思考 题 


1. 简 述 计算 体系 结构 的 两 个 发 展 方向 。 说 明 计 算 体系 结构 的 Flynn 分 类 法 的 分 类 依 
据 , 这 种 分 类 中 各 类 计算 机 的 结构 特点 是 什么 ? 

2. 为 什么 并 行 计算 机 系统 能 够 得 到 快速 的 发 展 ? 

3. 互联 网 络 的 交换 结 点 一 般 有 哪 几 种 设计 方案 ?解释 各 种 方案 的 工作 过 程 并 说 明 各 
种 不 同方 案 的 优点 和 缺点 。 

4. 有 一 个 8X8X8 的 立方 体 互联 网 络 ,每 条 链 路 的 全 双 工 带宽 是 1GB/s。 请 问 网 络 的 
对 分 带宽 是 多 大 ? 

5. Amdahl 定律 限制 了 并 行 计算 机 能 够 获得 的 最 大 的 加 速 比 。 我 们 把 函数 /定义 为 在 
CPU 数量 不 限 的 情况 下 程序 能 达到 的 最 大 的 加 速 比 。 请 问 /==0. 1 是 什么 含义 ? 

6. 图 13.8 是 总 线 不 能 扩展 而 网 格 网 络 成 功 扩展 的 例子 。 假 定 每 条 总 线 或 者 链 路 的 带 
宽 为 和, 请 计算 图 中 4 种 情况 下 每 个 CPU 的 平均 带宽 。 然 后 把 系统 扩展 到 64 个 CPU 并 重 
复 上 面 的 计算 过 程 。 当 CPU 的 数量 趋 于 无 穷 时 ,系统 将 受到 什么 限制 ? 

7. 假定 有 nn 个 CPU 连接 在 同一 条 总 线 上 。 在 某 个 给 定 的 时 间 段 里 ,任何 一 个 CPU 使 
用 总 线 的 概率 都 是 p。 计 算出 现下 列 情况 的 出 现 概 率 : 四 总 线 空闲 (没有 任何 请 求 ) 。@ 只 
有 一 个 请 求 。@ 多 于 一 个 请 求 。 

8. 在 MESI Cache 一 致 性 协议 中 存在 某 个 Cache 行 确实 位 于 本 地 Cache 中 但 是 却 需要 
通过 总 线 来 寻找 该 行 的 情况 吗 ?” 如 果 存在 这 种 情况 ,请 解释 其 原因 。 

9. MESI Cache 一 致 性 协议 有 4 种 状态 ,其 他 的 写 回 式 Cache 一 致 性 协议 都 只 有 3 种 
状态 。MESI 中 的 哪个 状态 可 以 不 要 呢 ? 这样 做 的 结果 是 什么 ” 如果 你 只 能 选择 3 种 状 
态 ,你 会 选择 哪 3 种 ? 

10. 一 个 Omega 网 络 连接 了 4096 个 RISC CPU 和 4096 个 访问 速度 无 穷 快 的 内 存 模 
块 ,每 个 CPU 的 周期 是 60ns。 每 个 交换 部 件 的 延迟 时 间 是 5ns。 那 么 一 条 LOAD 指令 需 
要 多 少 个 延 时 槽 ? 

11. MPP 系统 与 COW 系统 有 哪些 相同 点 和 不 同 点 ? 
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